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(57) Abstract: The invention concerns the genome sequence and nucleotide sequences coding for Streptococcus agalactiae polypep- 
tides, such as cellular envelope polypeptides, or secreted or specific polypeptides, or polypeptides involved in the metabolism and the 
replication process, as well as vectors or cells comprising said sequences. The invention also concerns the use thereof for developing 
vaccines, diagnostic tools, DNA chips and for identifying therapeutic targets. 



(57) Abrege : L' invention a pour objet la sequence genomique et des sequences nucleotidiques codant pour des polypeptides de 
Streptococcus agalactiae, tels que des polypeptides d'enveloppe cellulaire, ou des polypeptides secretes ou specifiques, ou impliques 
dans le metabolisme et dans le processus de replication, ainsi que des vecteurs ou cellules incluant lesdites sequences. L' invention 
porte egalement sur leur application au developpement de vaccins, d'outils de diagnostic, de puces a ADN et a 1' identification de 
cibles therapeutiques. 
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Sequence du genome Streptococcus agalactiae, application au developpement de 
vaccins, d'outils de diagnostic, et a Identification de cibles therapeutiques. 

L'invention a pour objet la sequence genomique et des sequences nucleotidiques 
5 codant pour des polypeptides de Streptococcus agalactiae, tels que des polypeptides 
d'enveloppe cellulaire, ou des polypeptides secretes ou specifiques, ou impliques dans 
le metabolisme et dans le processus de replication, ainsi que des vecteurs ou cellules 
incluant lesdites sequences. L'invention porte egalement sur leur application au 
developpement de vaccins, d'outils de diagnostic, de puces a ADN et a Identification 
10 de cibles therapeutiques. 

Streptococcus agalactiae est un streptocoque P-hemolytique qui constitue la 
seule espece appartenant au groupe B de Lancefield (SGB). Les infections neonatales a 
streptocoques du groupe B posent un important probleme de sante publique qui ne se 

15 limite pas aux pays en voie de developpement. Leur incidence est de 2,5 pour 1 000 
naissances, avec un taux de mortalite qui varie actuellement dans les pays industrialises 
entre 4 et 10 % selon les etudes. Cette bacterie est responsable d'environ 20 % des 
meningites bacteriennes recensees en France et des sequelles neurologiques sont alors 
observees dans 25 a 50 % des cas. Elle est egalement a 1'origine de mort foetale in utero. 

20 Le polyoside capsulaire est Tantigene de surface majeur des SGB. Cinq serotypes (la, 
lb, II, III et V) sont generalement detectes au cours des infections humaines, le serotype 
III etant retrouve dans 75 % des infections neonatales avec atteinte meningee. Au 
niveau cellulaire et moleculaire, les differentes etapes du processus infectieux du a S. 
agalactiae sont encore peu connues. II est vraisemblable que, dans le cas du syndrome 

25 precoce (infections survenant dans les 24 premieres heures), la bacterie inhalee penetre 
dans les cellules de l'epithelium alveolaire du nouveau-ne et traverse cette barriere pour 
disseminer ulterieurement dans la circulation generale. La genese du syndrome tardif 
precoce (infections survenant entre le 7eme jour et le 3eme mois) et des autres 
infections a SGB reste encore tres mal comprise. Le seul facteur de virulence des SGB 

30 dont le role a ete clairement demontre est le polyoside capsulaire qui permet 
Techappement au systeme immunitaire de l'hote. La contribution exacte de certaines 
proteines de surface (antigene C, proteine Rib et C5a peptidase) a la virulence de cette 
bacterie est encore peu connue. 
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Une recherche realisee sur le site EXPASY (http://www.expasy.ch/) indique 
qu'il existe 112 references de sequences proteiques dans les banques Swissprot et 
TREMBL. Ce nombre inclut des proteines codees par des plasmides de S. agalactiae, 
Ces sequences representent done une vision partielle d'un nombre limite d'aspect de la 
5 biologie de S. agalactiae. La biosynthese de la capsule polysaccharidique est un des 
aspects les mieux connus de la virulence de cette bacterie. Par ailleurs, les genes codant 
pour 6 proteines exposees a la surface sont egalement connus (3). 

Afin d'apprehender de maniere globale les determinants genetiques impliques 

1 0 dans ces processus ainsi que le metabolisme de Streptococcus agalactiae, le sequen9age 
du genome de Streptococcus agalactiae a ete realise. Le genome de la souche 
Streptococcus agalactiae CIP 82.45 (ATCC 12403) qui a ete responsable d'une 
septicemic mortelle a ete choisi pour ce sequen9age. Cette souche possede un serotype 
capsulaire III, ne presente pas de resistance acquise aux antibiotiques, est genetiquement 

1 5 modifiable et est virulente dans un modele d'infection murin. La connaissance complete 
du genome est une etape cruciale pour la caracterisation des genes impliques dans le 
developpement du processus infectieux : adhesion et franchissement des structures 
epitheliales, echappement au systeme immunitaire et adaptation a des conditions de 
culture variees et souvent hostiles (pH, stress oxydatif et carences nutritionnelles), qui 

20 constituent des cibles potentielles pour de nouvelles strategies therapeutiques. La 
comparaison du genome de S. agalactiae avec ceux d'autres pathogenes a Gram positif 
{Streptococcus pyogenes. Streptococcus pneumoniae, Streptococcus mutans, 
Staphylococcus aureus, Listeria monocytogenes, ...) doit permettre d f identifier de 
nouveaux genes de virulence ainsi crue nouvelles cibles pour construire des souches de 

25 virulence attenuees et des vaccins. Les proteines de surfaces constituent des candidats 
pour une future preparation vaccinale. Dans les tableaux 2 et 6 ci-apres sont repertories 
respectivement 25 et 30 nouveaux genes, nouvellement identifies, codant pour des 
proteines potentiellement liees au peptidoglycane et presentant le motif de liaison 
LPXTG. 

30 

La sequence complete du genome de Streptococcus agalactiae (CIP 82.45 
(ATCC 12403)) a ete obtenue. Ce genome est constitue d'un chromosome long 
d'environ 2,2 Mb identifie ici sous forme de 138 contigs representes par les sequences 
SEQ ID No. 1 a SEQ ID No. 136, SEQ ID No. 138 et SEQ ID No. 139, et d'un plasmide 
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long de 45 kbases present dans la souche sequencee represents par la sequence SEQ ID 
No. 137. La sequence complete du genome est representee par la sequence SEQ ID No. 
2345. 

Une liste des phases codantes annotees identifiees par l'analyse des sequences de 
5 ces contigs est donnee au tableau 1 . 

Une liste des phases codantes pour des proteines de surface nouvellement 
identifiees est donnee au tableau 2 comme indique precedemment. 

Une liste des phases codantes annotees identifiees par l'analyse de la sequence 
genomique complete SEQ ID No. 2345 est donnee au tableau 3. 
1 0 Une liste des phases codantes pour des proteines de surface identifiees a partir 

de l'analyse de la sequence genomique complete SEQ ID No. 2345 est donnee au 
tableau 6 (proteines liees au peptidoglycane), tableau 8 (lipoproteines).Tableau 9 (autres 
proteines de suface), Tableau 10( proteines impliquees dans la biosynthese des 
composes polysaccharidiques) 

15 

La presente invention concerne les sequences nucleotidiques et polypeptidiques 
de Streptococcus agalactiae CIP 82.45 (ATCC 12403). 

Ainsi, c'est un objet de la presente invention que de caracteriser la sequence du 
genome de Streptococcus agalactiae, CIP 82.45 (ATCC 12403) contenu dans la banque 
20 genomique preparee a partir du genome de cette souche et deposee a la CNCM le 28 
decembre 2000 sous le numero 1-2610, ainsi que de tous les genes et sequences 
regulatrices non codantes contenus dans ledit genome. 

La presente invention concerne done une sequence nucleotidique isolee et/ou 
purifiee de Streptococcus agalactiae, caracterisee en ce qu'elle est choisie parmi les 
25 sequences SEQ ID No. 1 a SEQ ID No. 139 et la sequence SEQ ID No. 2345. 

La presente invention concerne egalement une sequence nucleotidique isolee 
et/ou purifiee, issue de Streptococcus agalactiae, caracterisee en ce qu'elle est choisie 
parmi : 

a) une sequence nucleotidique comportant au moins 75 %, 80 %, 85 %, 90 %, 95 % ou 
30 98 % d'identite avec une sequence choisie parmi SEQ ID No. 1 a SEQ ID No. 139 et 

SEQ ID No. 2345 ; 

b) une sequence nucleotidique hybridant dans des conditions de forte stringence avec 
une sequence choisie parmi SEQ ID No. 1 a SEQ ID No. 139 et SEQ ID No. 2345, 
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et comprenant au moins 20 nucleotides, de preference 25, 30, 35, 40, 50, 75, 100, 
150, 200, 250, 300, 400, 500, 750, 1000 ou 1500 nucleotides ; 

c) une sequence nucleotidique complementaire d'une sequence choisie parmi SEQ ID 
No. 1 a SEQ ID No. 139 et SEQ ID No. 2345, ou complementaire d'une sequence 

5 nucleotidique telle que definie en a), ou b), ou une sequence nucleotidique de TARN 

correspondant a Tune des sequences a) ou b) ; 

d) une sequence nucleotidique d'un fragment representatif d'une sequence choisie 
parmi SEQ ID No. 1 a SEQ ID No. 139 et SEQ ID No. 2345, ou d'un fragment 
representatif d'une sequence nucleotidique telle que definie en a), b) ou c) et 

10 comprenant au moins 20 nucleotides, de preference 25, 30, 35, 40, 50, 75, 100, 150, 

200, 250, 300, 400, 500, 750, 1000 ou 1500 nucleotides ; 

e) une sequence nucleotidique comprenant une sequence telle que definie en a), b), c) 
ou d) ; et 

f) une sequence nucleotidique telle que definie en a), b), c), d) ou e) modifiee, de 
15 preference comportant au plus 10 %, 5 %, 1 % ou 0, 5 % de nucleotides modifies par 

rapport a la sequence de reference. 

De fa<?on plus particuliere, la presente invention a egalement pour objet les 
sequences nucleotidiques isolees et/ou purifiees, caracterisees en ce qu'elles sont issues 
de SEQ ID No. 1 a SEQ ID No. 139 et SEQ ID No. 2345, et en ce qu'elles codent pour 
20 un polypeptide choisi parmi les polypeptides de sequence SEQ ID No. 140 a SEQ ID 
No. 2344, et SEQ ID No. 2346 a SEQ ID No. 4481. 

La presente invention concerne aussi de fa$on plus generale les sequences 
nucleotidiques issues de SEQ ID No. 1 a SEQ ID No. 139 et SEQ ID No. 2345, et 
codant pour un polypeptide de Streptococcus agalactia, telles qu'elles peuvent etre 
25 isolees a partir de SEQ ID No. 1 a SEQ ID No. 1 39 et SEQ ID No. 2345. 

De plus, les sequences nucleotidiques isolees et/ caracterisees en ce qu'elles 
comprennent une sequence nucleotidique choisie parmi : 

a) une sequence nucleotidique codant pour un polypeptide choisi parmi les sequences 
SEQ ID No. 140 a SEQ ID No. 2344 et SEQ ID No. 2346 a SEQ ID No. 4481 ; 
30 b) une sequence nucleotidique comportant au moins 75 %,. 80 %, 85 %, 90 %, 95 % ou 
98 % d'identite avec une sequence nucleotidique codant pour un polypeptide choisi 
parmi les sequences SEQ ID No. 140 a SEQ ID No. 2344 et SEQ ID No. 2346 a SEQ 
ID No. 4481 ; 
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c) une sequence nucleotidique s'hybridant dans des conditions de forte stringence avec 
une sequence nucleotidique codant pour un polypeptide, choisi parmi les sequences 
SEQ ID No. 140 a SEQ ID No. 2344 et SEQ ID No. 2346 a SEQ ID No. 4481, et 
comprenant au moins 20 nucleotides, de preference 25, 30, 35, 40, 50, 75, 100, 150, 

5 200, 250, 300, 400, 500, 750, 1000 ou 1500 nucleotides ; 

d) une sequence nucleotidique complementaire ou d'ARN correspondant a une 
sequence telle que definie en a), b) ou c) ; 

e) une sequence nucleotidique d'un fragment representatif d'une sequence telle que 
definie en a), b), c) ou d) et comprenant au moins 20 nucleotides, de preference 25, 

10 30, 35, 40, 50, 75, 100, 150, 200, 250, 300, 400, 500, 750, 1000 ou 1500 

nucleotides ; et 

f) une sequence telle que definie en a), b), c), d) ou e) modifiee, de preference 
comportant au plus 10 %, 5 %, 1 % ou 0,5 % de nucleotides modifies par rapport a la 
sequence de reference, 

1 5 sont egalement des objets de 1' invention. 

Selon une realisation avantageuse, l'invention a pour objet les sequences 
nucleotidiques isolees et/ caracterisees en ce qu'elles comprennent une sequence 
nucleotidique choisie parmi : 

a) une sequence nucleotidique SEQ ID No. 4482 a SEQ ID No. 6617 ; 
20 b) une sequence nucleotidique comportant au moins 75 %, 80 %, 85 %, 90 %, 95 % ou 
98 % d'identite avec une sequence nucleotidique choisi parmi les sequences SEQ ID 
No. 2346 a SEQ ID No. 4481 ; 

c) une sequence nucleotidique s'hybridant dans des conditions de forte stringence avec 
une sequence nucleotidique choisi parmi les sequences SEQ ID No. 4482 a SEQ ID 

25 No. 6617, et comprenant au moins 20 nucleotides, de preference 25, 30, 35, 40, 50, 

75, 100, 150, 200, 250, 300, 400, 500, 750, 1000 ou 1500 nucleotides ; 

d) une sequence nucleotidique complementaire ou d'ARN correspondant a une 
sequence telle que definie en a), b) ou c) ; 

e) une sequence nucleotidique d'un fragment representatif d'une sequence telle que 
30 definie en a), b), c) ou d) et comprenant au moins 20 nucleotides, de preference 25, 

30, 35, 40, 50, 75, 100, 150, 200, 250, 300, 400, 500, 750, 1000 ou 1500 
nucleotides ; et 
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f) une sequence telle que definie en a), b), c), d) ou e) modifiee, de preference 
comportant au plus 10 %, 5 %, 1 % ou 0,5 % de nucleotides modifies par rapport a la 
sequence de reference, 

5 Par acide nucleique, sequence nucleique ou d' acide nucleique, polynucleotide, 

oligonucleotide, sequence de polynucleotide, sequence nucleotidique, termes qui seront 
employes indifferemment dans la presente description, on entend designer un 
enchainement precis de nucleotides, modifies ou non, permettant de definir un fragment 
ou une region d'un acide nucleique, comportant ou non des nucleotides non naturels, et 

10 pouvant correspondre aussi bien a un ADN double brin, un ADN simple brin qu'a des 
produits de transcription desdits ADNs. Ainsi, les sequences nucleiques selon 
Tinvention englobent egalement les PNA (Peptid Nucleic Acid). 

II doit etre compris que la presente invention ne concerne pas les sequences 
nucleotidiques dans leur environnement chromosomique naturel, c'est-a-dire a 1'etat 

15 naturel. II s'agit de sequences qui ont ete isolees et/ou purifiees, c'est-a-dire qu'elles ont 
ete prelevees directement ou indirectement, par exemple par copie, leur environnement 
ayant ete au moins partiellement modifie. On entend ainsi egalement designer les acides 
nucleiques obtenus par synthese chimique. 

Par « pourcentage d'identite » entre deux sequences d'acides nucleiques ou 

20 d'acides amines au sens de la presente invention, on entend designer un pourcentage de 
nucleotides ou de residus d'acides amines identiques entre les deux sequences a 
comparer, obtenu apres le meilleur alignement, ce pourcentage etant purement 
statistique et les differences entre les deux sequences etant reparties au hasard et sur 
toute leur longueur. On entend designer par "meilleur alignement" ou "alignement 

25 optimal", Talignement pour lequel le pourcentage d'identite determine comme ci-apres 
est le plus eleve. Les comparaisons de sequences entre deux sequences d'acides 
nucleiques ou d'acides amines sont traditionnellement realisees en comparant ces 
sequences apres les avoir alignees de maniere optimale, ladite comparaison etant 
realisee par segment ou par « fenetre de comparaison » pour identifier et comparer les 

30 regions locales de similarite de sequence. L'alignement optimal des sequences pour la 
comparaison peut etre realise, outre manuellement, au moyen de l'algorithme 
d'homologie locale de Smith et Waterman (1981, Ad. App. Math. 2:482), au moyen de 
l'algorithme d'homologie locale de Neddleman et Wunsch (1970, J. Mol. Biol. 48:443), 
au moyen de la methode de recherche de similarite de Pearson et Lipman (1988, Proc. 
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Natl. Acad. Sci. USA 85:2444), au moyen de logiciels informatiques utilisant ces 
algorithmes (GAP, BESTFIT, BLAST P, BLAST N, FASTA et TFASTA dans le 
Wisconsin Genetics Software Package, Genetics Computer Group, 575 Science Dr., 
Madison, WI). Afm d'obtenir Falignement optimal, on utilise de preference le 
5 programme BLAST, avec la matrice BLOSUM 62. On peut egalement utiliser les 
matrices PAM ou PAM250. 

Le pourcentage d'identite entre deux sequences d'acides nucleiques ou d'acides 
amines est determine en comparant ces deux sequences alignees de maniere optimale, la 
sequence d'acides nucleiques ou d'acides amines a comparer pouvant comprendre des 

1 0 additions ou des deletions par rapport a la sequence de reference pour un alignement 
optimal entre ces deux sequences. Le pourcentage d'identite est calcule en determinant 
le nombre de positions identiques pour lesquelles le nucleotide ou le residu d'acide 
amine est identique dans les deux sequences, en divisant ce nombre de positions 
identiques par le nombre total de positions comparees et en multipliant le resultat 

1 5 obtenu par 100 pour obtenir le pourcentage d'identite entre ces deux sequences. 

Par sequences nucleiques presentant un pourcentage d'identite d'au moins 75 %, 
de preference 80 %, 85 % ou 90 %, de fa?on plus preferee 95 % voire 98 %, apres 
alignement optimal avec une sequence de reference, on entend designer les sequences 
nucleiques presentant, par rapport a la sequence nucleique de reference, certaines 

20 modifications comme en particulier une deletion, une troncation, un allongement, une 
fusion chimerique et/ou une substitution, notamment ponctuelle, et dont la sequence 
nucleique presente au moins 75 %, de preference 80 %, 85 %, 90 %, 95 % ou 98 %, 
d'identite apres alignement optimal avec la sequence nucleique de reference. II s'agit de 
preference de sequences dont les sequences complementaires sont susceptibles de 

25 s'hybrider speciflquement avec les sequences de reference. De preference, les 
conditions d'hybridation specifiques ou de forte stringence seront telles qu'elles 
assurent au moins 75 %, de preference 80 %, 85 %, 90 %, 95 % ou 98 % d'identite 
apres alignement optimal entre l'une des deux sequences et sa sequence 
complementaire. 

30 Une hybridation dans des conditions de forte stringence signifie que les 

conditions de temperature et de force ionique sont choisies de telle maniere qu'elles 
permettent le maintien de l'hybridation entre deux fragments d'ADN complementaires. 
A titre illustratif, des conditions de forte stringence de 1'etape d'hybridation aux fins de 
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definir les fragments polynucleotidiques decrits ci-dessus, sont avantageusement les 
suivantes. 

L'hybridation ADN-ADN ou ADN-ARN est realisee en deux etapes : (1) 
prehybridation a 42°C pendant 3 heures en tampon phosphate (20 mM, pH 7,5) 
5 contenant 5 x SSC (1 x SSC correspond a une solution 0,15 M NaCl + 0 5 0 1 5 M citrate 
de sodium), 50 % de formamide, 7 % de sodium dodecyl sulfate (SDS), 10 x 
Denhardt's, 5 % de dextran sulfate et 1 % d'ADN de sperme de saumon ; (2) hybridation 
proprement dite pendant 20 heures a une temperature dependant de la taille de la sonde 
(i.e. : 42°C, pour une sonde de taille > 100 nucleotides) suivie de 2 lavages de 20 
10 minutes a 20°C en 2 x SSC + 2 % SDS, 1 lavage de 20 minutes a 20°C en 0,1 x SSC + 
0,1 % SDS. Le dernier lavage est pratique en 0,1 x SSC + 0,1 % SDS pendant 30 
minutes a 60°C pour une sonde de taille > 100 nucleotides. Les conditions d'hybridation 
de forte stringence decrites ci-dessus pour un polynucleotide de taille definie, peuvent 
etre adaptees par Phomme du metier pour des oligonucleotides de taille plus grande ou 
15 plus petite, selon l'enseignement de Sambrook et al., (1989, Molecular cloning : a 
laboratory manual. 2 nd Ed. Cold Spring Harbor). 

De plus, par fragment representatif de sequences selon V invention, on entend 
designer tout fragment nucleotidique presentant au moins 1 5 nucleotides, de preference 
au moins 25, 30, 35, 40, 50, 75, 100, 150, 200, 250, 300, 400, 450, 500, 750, 1000 ou 
20 1 500 consecutifs de la sequence dont il est issu. 

Par fragment representatif, on entend en particulier une sequence nucleique 
codant pour un fragment biologiquement actif d'un polypeptide, tel que defini plus loin. 

Par fragment representatif, on entend egalement les sequences intergeniques, et 
en particulier les sequences nucleotidiques portant les signaux de regulation 
25 (promoteurs, terminateurs, voire enhancers, . . .). 

Parmi lesdits fragments representatifs, on prefere ceux ayant des sequences 
nucleotidiques correspondant a des cadres ouverts de lecture, denommes sequences 
ORFs (ORF pour « Open Reading Frame »), compris en general entre un codon 
d' initiation et un codon stop, ou entre deux codons stop, et codant pour des 
30 polypeptides, de preference d'au moins 100 acides amines, tel que par exemple, sans s'y 
limiter, les sequences ORFs qui seront decrites par la suite. 

La numerotation des sequences nucleotidiques ORFs qui sera utilisee par la suite 
dans la presente description correspond a la numerotation des sequences d'acides 
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amines des proteines codees par lesdites ORFs pour les peptides de sequence SEQ ID 
No. 140 a SEQ ID No. 2344 et SEQ ID No.2346 a SEQ ID No.4481. 

Les fragments representatifs selon 1' invention peuvent etre obtenus par exemple 
par amplification specifique telle que la PCR ou apres digestion par des enzymes de 
5 restriction appropries de sequences nucleotidiques selon P invention, cette methode etant 
decrite en particulier dans Fouvrage de Sambrook et aL. Lesdits fragments 
representatifs peuvent egalement etre obtenus par synthese chimique lorsque leur taille 
n'est pas trop importante, selon des methodes bien connues de Phomme du metier. 

Parmi les sequences contenant des sequences de F invention, ou des fragments 
1 0 representatifs, on entend egalement les sequences qui sont naturellement encadrees par 
des sequences qui presentent au moins 75 %, 80 %, 85 %, 90 %, 95 % ou 98 % 
d'identite avec les sequences selon Finvention. 

Par sequence nucleotidique modifiee, on entend toute sequence nucleotidique 
obtenue par mutagenese selon des techniques bien connues de Fhomme du metier, et 
15 comportant des modifications par rapport aux sequences normales, par exemple des 
mutations dans les sequences regulatrices et/ou promotrices de Fexpression du 
polypeptide, notamment conduisant a une modification du taux d'expression ou de 
Factivite dudit polypeptide. 

Par sequence nucleotidique modifiee, on entend egalement toute sequence 
20 nucleotidique codant pour un polypeptide modifie tel que definit ci-apres. 

Concernant les sequences nucleiques ou ORF codant pour les peptides de 
sequence SEQ ID No. 2346 a SEQ ID No. 4481, ces sequences nucleiques ou ORF sont 
representees respectivement par les sequences SEQ ID No. 4482 a SEQ ID No. 6617. 

L' invention concerne avantageusement une sequence nucleotidique isolee de 
25 Streptococcus agalactiae, caracterisee en ce qu'elle est choisie parmi : 

a) une sequence choisie parmi les sequences SEQ ID N° 
6194,6236,5497,5791,5103,4705,5610,5234,4926,6331,6247,5842,5741,4921,5090, 
5180,4706,4708,5677,6246,6411,5578,6446,6447,5607,6209,6215,5406,5658,4965, de 
preference parmi les sequences SEQ ID N°4926,633 1,5491,5234,6246,5842 ; 
30 b) une sequence nucleotidique comportant au moins 75 % d'identite avec une 

sequence nucleotidique du a) ; 

c) une sequence nucleotidique s'hybridant dans des conditions de forte 
stringence avec une sequence nucleotidique du a) ou b) et comprenant au moins 20 
nucleotides ; 
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d) une sequence nucleotidique complementaire ou d'ARN correspondant a une 
sequence telle que definie en a), b) ou c) ; 

e) une sequence nucleotidique d'un fragment representatif d'une sequence telle 
que definie en a), b), c) ou d) et comprenant au moins 20 nucleotides ; et 

5 f) une sequence telle que definie en a), b), c), d) ou e) modifiee et comportant 

au plus 1 0 % de nucleotides modifies par rapport a la sequence de reference ; 

et en ce qu'elle code pour une proteine de surface avec un motif d'ancrage 
LPXTG. 

L'invention concerne egalement les polypeptides codes par ces sequences. 
10 L'invention concerne egalement avantageusement une sequence nucleotidique 

isolee de Streptococcus agalactiae caracterisee en ce qu'elle est choisie parmi les 
sequences SEQ ID 

N%035,6137,6335,6377,6386 9 4495,45%^^ 

5247, 5306,5417,5450,5486,5559,5591,5677,5732,5799,5800,5861,5923 ; et en ce 

15 qu'elle code pour une lipoproteins L'invention concerne egalement les polypeptides 
codes par ces sequences. 

L'invention concerne egalement avantageusement une sequence nucleotidique 
isolee de Streptococcus agalactiae, caracterisee en ce qu'elle est choisie parmi les 
sequences SEQ ID 

20 NM861,6214,6061,6517,6518,6519,4743,6343,6342^^ 

5615,5614,5613,561 1,5696,5971 ,5233,5602,5 156,5574,5573,5654,5656,5526,5527,552 
9,5534,5625,5626,6223,6229,6230,6231,6232,6233,5764,6095,5089,5466,5465 ; et en 
ce qu'elle code pour une proteine impliquee dans la biosynthese de composes 
polysaccharidiques de paroi. L'invention concerne egalement les polypeptides codes par 

25 ces sequences. 

Les fragments representatifs selon l'invention peuvent egalement etre des sondes 
ou amorces, qui peuvent etre utilisees dans des precedes de detection, d'identification, 
de dosage ou d' amplification de sequences nucleiques. 

Une sonde ou amorce se definit, au sens de l'invention, comme etant un 

30 fragment d'acides nucleiques simple brin ou un fragment double brin denature 
comprenant par exemple de 12 bases a quelques kb, notamment de 15 a quelques 
centaines de bases, de preference de 15 a 50 ou 100 bases, et possedant une specificite 
d'hybridation dans des conditions determinees pour former un complexe d'hybridation 
avec un acide nucleique cible. 
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Les sondes et amorces selon F invention peuvent etre marquees directement ou 
indirectement par un compose radioactif ou non radioactif par des methodes bien 
connues de Fhomme du metier, afin d'obtenir un signal detectable et/ou quantifiable 
(brevet FR 78 10975 et bDNA de Chiron EP 225 807 et EP 510 085). 
5 Les sequences non marquees de polynucleotides selon Finvention peuvent etre 

utilisees directement comme sonde ou amorce. 

Les sequences sont generalement marquees pour obtenir des sequences 
utilisables pour de nombreuses applications. Le marquage des amorces ou des sondes 
selon Finvention est realise par des elements radioactifs ou par des molecules non 
1 0 radioactives. 

Parmi les isotopes radioactifs utilises, on peut citer le 32 P, le 33 P, le 35 S, le 3 H ou 
le 125 I. Les entites non radioactives sont selectionnees parmi les ligands tels la biotine, 
l'avidine, la streptavidine, la dioxygenine, les haptenes, les colorants, les agents 
luminescents tels que les agents radioluminescents, chemoluminescents, 

1 5 bioluminescents, fluorescents, phosphorescents. 

Les polynucleotides selon Finvention peuvent ainsi etre utilises comme amorce 
et/ou sonde dans des procedes mettant en oeuvre notamment la technique de PCR 
(amplification en chame par polymerase) (Rolfs et al., 1991, Berlin : Springer-Verlag). 
Cette technique necessite le choix de paires d'amorces oligonucleotidiques encadrant le 

20 fragment qui doit etre amplifie. On peut, par exemple, se referer a la technique decrite 
dans le brevet americain U.S. N° 4,683,202. Les fragments amplifies peuvent etre 
identifies, par exemple apres une electrophorese en gel d' agarose ou de polyacrylamide, 
ou apres une technique chromatographique comme la filtration sur gel ou la 
chromatographic echangeuse d'ions, puis sequences. La specificite de F amplification 

25 peut etre controlee en utilisant les sequences nucleotidiques de polynucleotides de 
Finvention comme matrice, des plasmides contenant ces sequences ou encore les 
produits d' amplification derives. Les fragments nucleotidiques amplifies peuvent etre 
utilises comme reactifs dans des reactions d'hybridation afin de mettre en evidence la 
presence, dans un echantillon biologique, d'un acide nucleique cible de sequence 

30 complementaire a celle desdits fragments nucleotidiques amplifies. 

L'invention vise egalement les acides nucleiques susceptibles d'etre obtenus par 
amplification a Faide d'amorces selon Finvention. 

D'autres techniques d' amplification de Facide nucleique cible peuvent etre 
avantageusement employees comme alternative a la PCR (PCR-like) a Faide de couple 
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d 5 amorces de sequences nucleotidiques selon 1' invention. Par PCR-like on entend 
designer toutes les methodes mettant en oeuvre des reproductions directes ou indirectes 
des sequences d'acides nucleiques, ou bien dans lesquelles les systemes de marquage 
ont ete amplifies, ces techniques sont bien entendu connues. En general il s'agit de 
5 P amplification de PADN par une polymerase ; lorsque Pechantillon d'origine est un 
ARN il convient prealablement d'effectuer une transcription reverse. II existe 
actuellement de tres nombreux precedes permettant cette amplification, comme par 
exemple la technique SDA (Strand Displacement Amplification) ou technique 
d'amplification a deplacement de brin (Walker et al., 1992, Nucleic Acids Res. 

10 20:1691), la technique TAS (Transcription-based Amplification System) decrite par 
Kwoh et al. (1989, Proc. Natl. Acad. ScL, USA, 86, 1173), la technique 3SR (Self- 
Sustained Sequence Replication) decrite par Guatelli et al. (1990, Proc. Natl. Acad. Sci., 
USA 87:1874), la technique NASBA (Nucleic Acid Sequence Based Amplification) 
decrite par Kievitis et al. (1991, J. Virol. Methods, 35, 273), la technique TMA 

15 (Transcription Mediated Amplification), la technique LCR (Ligase Chain Reaction) 
decrite par Landegren et al. (1988, Science 241, 1077), la technique de RCR (Repair 
Chain Reaction) decrite par Segev (1992, Kessler C. Springer Verlag, Berlin, New- 
York, 197-205), la technique CPR (Cycling Probe Reaction) decrite par Duck et al. 
(1990, Biotechniques, 9, 142), la technique d' amplification a la Q-beta-replicase decrite 

20 par Miele et al. (1983, J. Mol. Biol., 171, 281). Certaines de ces techniques ont depuis 
ete perfectionnees. 

Dans le cas ou le polynucleotide cible a detecter est un ARNm, on utilise 
avantageusement, prealablement a la mise en oeuvre d'une reaction d' amplification a 
Paide des amorces selon Pinvention ou a la mise en oeuvre d'un precede de detection a 

25 Paide des sondes de Pinvention, une enzyme de type transcriptase inverse afin d'obtenir 
un ADNc a partir de PARNm contenu dans Pechantillon biologique. L'ADNc obtenu 
servira alors de cible pour les amorces ou les sondes mises en oeuvre dans le precede 
d'amplification ou de detection selon Pinvention. 

La technique d'hybridation de sondes peut etre realisee de manieres diverses 

30 (Matthews et al., 1988, Anal. Biochem., 169, 1-25). La methode la plus generate 
consiste a immobiliser Pacide nucleique extrait des cellules de differents tissus ou de 
cellules en culture sur un support (tels que la nitrocellulose, le nylon, le polystyrene) et 
a incuber, dans des conditions bien definies, Pacide nucleique cible immobilise avec la 
sonde. Apres Phybridation, Pexces de sonde est elimine et les molecules hybrides 
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formees sont detectees par la methode appropriee (mesure de la radioactivite, de la 
fluorescence ou de l'activite enzymatique liee a la sonde). 

Selon un autre mode de mise en oeuvre des sondes nucleiques selon l'invention, 
ces dernieres peuvent etre utilisees comme sondes de capture. Dans ce cas, une sonde, 
5 dite « sonde de capture », est immobilisee sur un support et sert a capturer par 
hybridation specifique l'acide nucleique cible obtenu a partir de l'echantillon biologique 
a tester et l'acide nucleique cible est ensuite detecte grace a une seconde sonde, dite 
« sonde de detection », marquee par un element facilement detectable. 

Parmi les fragments d'acides nucleiques interessants, il faut ainsi citer en 

10 particulier les oligonucleotides anti-sens, c'est-a-dire dont la structure assure, par 
hybridation avec la sequence cible, une inhibition de l'expression du produit 
correspondant. II faut egalement citer les oligonucleotides sens qui, par interaction avec 
des proteines impliquees dans la regulation de l'expression du produit correspondant, 
induiront soit une inhibition, soit une activation de cette expression. 

15 De fa<?on preferee, les sondes ou amorces selon l'invention sont immobilisees 

sur un support, de maniere covalente ou non covalente. En particulier, le support peut 
etre une puce a ADN ou un filtre a haute ou moyenne densite, egalement objets de la 
presente invention (brevets WO 97/29212, WO 98/27317, WO 97/10365 et WO 
92/10588). 

20 On entend designer par puce a ADN ou filtre haute densite, un support sur lequel 

sont fixees des sequences d'ADN, chacune d'entre elles pouvant etre reperee par sa 
localisation geographique. Ces puces ou filtres different principalement par leur taille, le 
materiau du support, et eventuellement le nombre de sequences d'ADN qui y sont 
fixees. 

25 On peut fixer les sondes ou amorces selon la premiere invention sur des supports 

solides, en particulier les puces a ADN, par differents procedes de fabrication. En 
particulier, on peut effectuer une synthese in situ par adressage photochimique ou par jet 
d'encre. D'autres techniques consistent a effectuer une synthese ex situ et a fixer les 
sondes sur le support de la puce a ADN par adressage mecanique, electronique ou par 

30 jet d'encre. Ces differents procedes sont bien connus de l'homme du metier. 

Une sequence nucleotidique (sonde ou amorce) selon l'invention permet done la 
detection et/ou l'amplification de sequences nucleiques specifiques. En particulier, la 
detection de cesdites sequences est facilitee lorsque la sonde est fixee sur une puce a 
ADN, ou a un filtre haute densite. 
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L'utilisation de puces a ADN ou de filtres a haute densite permet en effet de 
determiner P expression de genes dans un organisme presentant une sequence 
genomique proche de Streptococcus agalactiae et le typage de la souche en cause. 

La sequence genomique de Streptococcus agalactiae, completee par 
5 P identification des genes de ces organismes, telle que presentee dans la presente 
invention, sert de base a la construction de ces puces a ADN ou filtre. 

La preparation de ces filtres ou puces consiste a synthetiser des oligonucleotides, 
correspondant aux extremites 5' et 3' des genes ou a des fragments plus internes pour 
amplifier des fragments d'une taille adaptee, par exemple comprise environ entre 300 et 

10 800 bases. Ces oligonucleotides sont choisis en utilisant la sequence genomique et ses 
annotations divulguees par la presente invention. La temperature d'appariement des ces 
oligonucleotides aux places correspondantes sur l'ADN doit etre approximativement la 
meme pour chaque oligonucleotide. Ceci permet de preparer des fragments d'ADN 
correspondant a chaque gene par l'utilisation de conditions de PCR appropriees dans un 

1 5 environnement hautement automatise. Les fragments amplifies sont ensuite immobilises 
sur des filtres ou des supports en verre, silicium ou polymeres synthetiques et ces 
milieux sont utilises pour Phybridation. 

La disponibilite de tels filtres et/ou puces et de la sequence genomique 
correspondante annotee permet d'etudier l'expression de grands ensembles, voire de la 

20 totalite des genes dans les micro-organismes associes a Streptococcus agalactiae et 
Streptococcus agalactiae CIP 82.45 (ATCC 12403), en preparant les ADNs 
complementaires, et en les hybridant a l'ADN ou aux oligonucleotides immobilises sur 
les filtres ou les puces. De meme, les filtres et/ou les puces permettent d'etudier la 
variability des souches ou des especes, en preparant l'ADN de ces organismes et en les 

25 hybridant a l'ADN ou aux oligonucleotides immobilises sur les filtres ou les puces. 

Les differences entre les sequences genomiques des differentes souches ou 
especes peuvent grandement affecter l'intensite de Thybridation et, par consequent, 
perturber Interpretation des resultats. II peut done etre necessaire d'avoir la sequence 
precise des genes de la souche que Ton souhaite etudier. La methode de detection des 

30 genes decrite plus loin en detail, impliquant la determination de la sequence de 
fragments aleatoires d'un genome, et les organisant d'apres la sequence du genome de 
Streptococcus agalactiae, notamment de Streptococcus agalactiae CIP 82.45 (ATCC 
12403) divulguee dans la presente invention, peut etre tres utile. 
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Les sequences nucleotidiques selon 1' invention peuvent etre utilisees dans des 
puces a ADN pour effectuer 1 5 analyse de mutations. Cette analyse repose sur la 
constitution de puces capables d'analyser chaque base d'une sequence nucleotidique 
selon l'invention. On pourra notamment a cette fin mettre en oeuvre les techniques de 
5 microsequen?age sur puce a ADN. Les mutations sont detectees par extension 
d'amorces immobilisees hybridant a la matrice des sequences analysees, juste en 
position adjacente de celle du nucleotide mute recherche. Une matrice simple brin, ARN 
ou ADN, des sequences a analyser sera avantageusement preparee selon des methodes 
classiques, a partir de produits amplifies selon les techniques de type PCR. Les matrices 

1 0 d'ADN simple brin, ou d'ARN ainsi obtenues sont alors deposees sur la puce a ADN, 
dans des conditions permettant leur hybridation specifique aux amorces immobilisees. 
Une polymerase thermostable, par exemple la Tth ou la Taq ADN polymerase, etend 
specifiquement Textremite 3' de Tamorce immobilisee avec un analogue de nucleotide 
marque complementaire du nucleotide en position du site variable ; par exemple, un 

1 5 cyclage thermique est realise en presence des dideoxyribonucleotides fluorescents. Les 
conditions experimentales seront adaptees notamment aux puces employees, aux 
amorces immobilisees, aux polymerases employees, et au systeme de marquage choisi. 
Un avantage du microsequen9age, par rapport aux techniques basees sur l'hybridation 
de sondes, est qu'il permet d'identifier tous les nucleotides variables avec une 

20 discrimination optimale dans des conditions de reactions homogenes ; utilise sur des 
puces a ADN, il permet une resolution et une specificite optimales pour la detection 
routiniere et industrielle de mutations en multiplex. 

Une puce a ADN ou un filtre peut etre un outil extremement interessant pour la 
determination, la detection et/ou 1' identification d'un micro-organisme. Ainsi, on 

25 prefere egalement les puces a ADN selon l'invention qui contiennent en outre au moins 
une sequence nucleotidique d'un micro-organisme autre que Streptococcus agalactiae 
CIP 82.45 (ATCC 12403) ou Streptococcus agalactiae, immobilisee sur le support de 
ladite puce. De preference, le micro-organisme choisi Test parmi les bacteries du genre 
Streptococcus (ci-apres designees comme bacteries associees a Streptococcus 

30 agalactiae), ou les variants de Streptococcus agalactiae CIP 82.45 (ATCC 12403). 

Une puce a ADN ou un filtre selon l'invention est un element tres utile de 
certains kits ou necessaires pour la detection et/ou 1' identification de micro-organismes, 
en particulier les bacteries appartenant a l'espece Streptococcus agalactiae ou les 
micro-organismes associes, egalement objets de l'invention. 
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Par ailleurs, les puces a ADN ou les filtres selon T invention, contenant des 
sondes ou amorces specifiques de Streptococcus agalactiae^ sont des elements tres 
avantageux de kits ou necessaires pour la detection et/ou la quantification de 
Pexpression de genes de Streptococcus agalactiae (ou de micro-organismes associes). 
5 En effet, le controle de Texpression des genes est un point critique pour 

optimiser la croissance et le rendement d'une souche, soit en permettant Pexpression 
d'un ou plusieurs genes nouveaux, soit en modifiant Texpression de genes deja presents 
dans la cellule. La presente invention fournit Tensemble des sequences naturellement 
actives chez Streptococcus agalactiae permettant Texpression des genes. Elle permet 

10 ainsi la determination de Tensemble des sequences exprimees chez Streptococcus 
agalactiae. Elle fournit egalement un outil permettant de reperer les genes dont 
Texpression suit un schema donne. Pour realiser cela, P ADN de tout ou partie des genes 
de Streptococcus agalactiae peut etre amplifie grace a des amorces selon Tinvention, 
puis fixe a un support comme par exemple le verre ou le nylon ou une puce a ADN, afin 

15 de construire un outil permettant de suivre le profil d'expression de ces genes. Cet outil, 
constitue de ce support contenant les sequences codantes sert de matrice d'hybridation a 
un melange de molecules marquees refletant les ARNs messagers exprimes dans la 
cellule (en particulier les sondes marquees selon Pinvention). En repetant cette 
experience a differents instants et en combinant Tensemble de ces donnees par un 

20 traitement approprie, on obtient alors les profils d'expression de Tensemble de ces 
genes. La connaissance des sequences qui suivent un schema de regulation donne peut 
aussi etre mise a profit pour rechercher de maniere dirigee, par exemple par homologie, 
d'autres sequences suivant globalement, mais de maniere legerement differente le meme 
schema de regulation. En complement, il est possible d'isoler chaque sequence de 

25 controle presente en amont des segments servant de sondes et d*en suivre Tactivite a 
Taide de moyen approprie comme un gene rapporteur (luciferase, P-galactosidase, 
GFP). Ces sequences isolees peuvent ensuite etre modifiees et assemblees par ingenierie 
metabolique avec des sequences d'interet en vue de leur expression optimale. 

L'invention concerne egalement les polypeptides codes par une sequence 

30 nucleotidique selon Pinvention, de preference, par un fragment representatif des 
sequences precedentes et correspondant a une sequence ORF. En particulier, les 
polypeptides de Streptococcus agalactiae CIP 82.45 (ATCC 12403) de SEQ ID No. 140 
a SEQ ID No. 2344 et SEQ ID No. 2346 a SEQ ID No. 4481 sont objet de Pinvention. 
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L'invention comprend egalement les polypeptides caracterises en ce qu'ils 
comprennent un polypeptide choisi parmi : 

a) un polypeptide selon l'invention ; 

b) un polypeptide presentant au moins 80 % de preference 85 %, 90 %, 95 % et 98 % 
5 d'identite avec un polypeptide selon Finvention ; 

c) un fragment d'au moins 5 acides amines, de preference d'au moins 10, 15, 20, 25, 
30, 40, 50, 75 et 100 acides amines d'un polypeptide selon l'invention, ou tel que 
defini en b) ; 

d) un fragment biologiquement actif d'un polypeptide selon l'invention, ou tel que 
1 0 defini en b) ou c) ; et 

e) un polypeptide selon l'invention, ou tel que defini en b), c) ou d) modifie et 
comportant au plus 10 %, 5 % ou 1 % d'acides amines modifies par rapport a la 
sequence de reference. 

Les sequences nucleotidiques codant pour les polypeptides decrits 
1 5 precedemment sont egalement objet de l'invention. 

Dans la presente description, les termes polypeptides, sequences 
polypeptidiques, peptides et proteines sont interchangeables. Le terme polypeptide 
comprend toute sequence d'acides amines permettant de generer une reponse anticorps. 

II doit etre compris que l'invention ne concerne pas les polypeptides sous forme 
20 naturelle, c'est-a-dire qu'ils ne sont pas pris dans leur environnement naturel. En 
revanche, elle concerne ceux qui ont pu etre isoles ou obtenus par purification a partir 
de sources naturelles, ou bien obtenus par recombinaison genetique, ou par synthese 
chimique, et qu'ils peuvent alors comporter des acides amines non naturels comme cela 
sera decrit plus loin. 

25 Par polypeptide presentant un certain pourcentage d'identite avec un autre, que 

Ton designera egalement par polypeptide homologue, on entend designer les 
polypeptides presentant par rapport aux polypeptides naturels, certaines modifications, 
en particulier une deletion, addition ou substitution d'au moins un acide amine, une 
troncation, un allongement, une solution chimerique et/ou une mutation, ou les 

30 polypeptides presentant des modifications post-traductionnelles. Parmi les polypeptides 
homologues, on prefere ceux dont la sequence d'acides amines presentent au moins 
80%, de preference 85 %, 90 %, 95 % et 98 % d'homologie avec les sequences 
d'acides amines des polypeptides selon l'invention. Dans le cas d'une substitution, un 
ou plusieurs acide(s) amine(s) consecutif(s) ou non consecutif(s) sont remplaces par des 
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acides amines « equivalents ». L'expression « acides amines equivalents » vise ici a 
designer tout acide amine susceptible d'etre substitue a Tun des acides amines de la 
structure de base sans cependant modifier essentiellement les activites biologiques des 
peptides correspondant telles qu'elles seront definies par la suite. 
5 Ces acides amines equivalents peuvent etre determines soit en s'appuyant sur 

leur homologie de structure avec les acides amines auxquels ils se substituent, soit sur 
des resultats d'essais comparatifs d'activite biologique entre les differents polypeptides 
susceptibles d'etre effectues. 

A titre d'exemple, on mentionne les possibilites de substitution susceptibles 

10 d'etre effectuees sans qu'il resulte en une modification approfondie de l'activite 
biologique du polypeptide modifie correspondant. On peut remplacer ainsi la leucine 
par la valine ou l'isoleucine, 1'acide aspartique par 1'acide glutamine, la glutamine par 
1'asparagine, l'arginine par la lysine, etc., les substitutions inverses etant naturellement 
envisageables dans les memes conditions. 

1 5 Les polypeptides homologues correspondent egalement aux polypeptides codes 

par les sequences nucleotidiques homologues ou identiques, telles que definies 
precedemment et comprennent ainsi dans la presente definition des polypeptides mutes 
ou correspondant a des variations inter ou intra especes, pouvant exister chez 
Streptococcus , et qui correspondent notamment a des troncatures, substitutions, 

20 deletions et/ou additions, d'au moins un residu d'acides amines. 

U est entendu que Ton calcule le pourcentage d'identite entre deux polypeptides 
de la meme fa?on qu'entre deux sequences d'acides nucleiques. Ainsi, le pourcentage 
d'identite entre deux polypeptides est calcule apres alignement optimal de ces deux 
sequences, sur une fenetre d'homologie maximale. Pour definir ladite fenetre 

25 d'homologie maximale, on peut utiliser les memes algorithmes que pour les sequences 
d'acide nucleique. 

Par fragment biologiquement actif d'un polypeptide selon 1' invention, on entend 
designer en particulier un fragment de polypeptide, tel que defini ci-apres, presentant au 
moins une des caracteristiques biologiques des polypeptides selon l'invention, 
30 notamment en ce qu'il est capable d'exercer de maniere generale une activite meme 
partielle, telle que par exemple : 

- une activite enzymatique (metabolique) ou une activite pouvant etre 
impliquee dans la biosynthese ou la biodegradation de composes organiques ou 
inorganiques ; 
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- une activite structurelle (enveloppe cellulaire, molecule chaperonne, 
ribosome) ; 

- une activite de transport (d'energie, d'ion) ; ou dans la secretion de proteine ; 

- une activite dans le processus de replication, amplification, preparation, 
5 transcription, traduction ou maturation, notamment de l'ADN, de TARN ou des 

proteines. 

Par fragment de polypeptide selon l'invention, on entend designer un 
polypeptide comportant au minimum 5 acides amines, de preference d'au moins 10, 15, 
20, 25, 30, 40, 50, 75, 100 et 150 acides amines. 

1 0 Les fragments de polypeptides peuvent corresponds a des fragments isoles ou 

purifies naturellement presents dans les souches de Streptococcus, ou a des fragments 
qui peuvent etre obtenus par clivage dudit polypeptide par une enzyme proteolitique 
telle que la trypsine ou la chymotrypsine ou la collagenase, par un reactif chimique 
(bromure de cyanogene, CNBr) ou en pla9ant ledit polypeptide dans un environnement 

1 5 tres acide (par exemple a pH = 2,5). Des fragments polypeptidiques peuvent egalement 
etre prepares par synthese chimique, a partir d'hotes transformes par un vecteur 
d'expression selon Pinvention qui contiennent un acide nucleique permettant 
F expression dudit fragment, et place sous le controle des elements de regulation et/ou 
d'expression appropries. 

20 Par « polypeptide modifie » d'un polypeptide selon l'invention, on entend 

designer un polypeptide obtenu par recombinaison genetique ou par synthese chimique 
comme decrit plus loin, qui presente au moins une modification par rapport a la 
sequence normale. Ces modifications peuvent etre notamment portees sur des acides 
amines necessaires pour la specificite ou l'efficacite de l'activite, ou a l'origine de la 

25 conformation structurale, de la charge, ou de Fhydrophobicite du polypeptide selon 
l'invention. On peut ainsi creer des polypeptides d'activite equivalente, augmentee ou 
diminuee, ou de specificite equivalente, plus etroite ou plus large. Parmi les 
polypeptides modifies, il faut citer les polypeptides dans lesquels jusqu'a cinq acides 
amines peuvent etre modifies, tronques a Pextremite N ou C-terminale, ou bien deletes, 

30 ou ajoutes. 

Comme cela est indique, les modifications d'un polypeptide ont pour objectif 
notamment : 

- de permettre sa mise en ceuvre dans des procedes de biosynthese ou de 
biodegradation de composes organiques ou inorganiques, 
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- de permettre sa mise en oeuvre dans des procedes de replication, 
d'amplification, de reparation et regie de transcription, de traduction, ou de maturation 
notamment de FADN, TARN, ou de proteines, 

- de permettre sa secretion amelioree, 

5 -de modifier sa solubilite, l'efficacite ou la specificite de son activite, ou 

encore de faciliter sa purification. 

La synthese chimique presente egalement Favantage de pouvoir utiliser des 
acides amines non naturels ou des liaisons non peptidiques. Ainsi, il peut etre 
interessant d'utiliser des acides amines non naturels, par exemple sous forme D, ou des 
1 0 analogues d'acides amines, notamment des formes souffrees. 

La presente invention fournit la sequence nucleotidique du genome de 
Streptococcus agalactiae CIP 82.45 (ATCC 12403) sous forme de contigs, ainsi que 
certaines sequences polypeptidiques. 

D'une maniere preferee, 1' invention est relative a une sequence nucleotidique 
15 selon Finvention, caracterisee en ce qu'elle code pour un polypeptide de Streptococcus 
agalactiae CIP 82.45 (ATCC 12403) ou un de ses fragments implique dans la 
biosynthese des acides amines. 

De maniere preferee, Finvention est relative a une sequence nucleotidique selon 
Finvention, caracterisee en ce qu'elle code pour un polypeptide de Streptococcus 
20 agalactiae CIP 82.45 (ATCC 12403) ou un de ses fragments implique dans la 
biosynthese des cofacteurs, groupes prosthetiques et transporters . 

De maniere preferee, Finvention est relative a une sequence nucleotidique selon 
Finvention, caracterisee en ce qu'elle code pour un polypeptide d'enveloppe cellulaire 
ou present a la surface de Streptococcus agalactiae CIP 82.45 (ATCC 12403) ou pour 
25 un de ses fragments. 

De maniere preferee, Finvention est relative a une sequence nucleotidique selon 
Finvention, caracterisee en ce qu'elle code pour un polypeptide de Streptococcus 
agalactiae CIP 82.45 (ATCC 12403) ou un de ses fragments implique dans la 
machinerie cellulaire. 

30 De maniere preferee, Finvention est relative a une sequence nucleotidique selon 

Finvention, caracterisee en ce qu'elle code pour un polypeptide de Streptococcus 
agalactiae CIP 82.45 (ATCC 12403) ou un de ses fragments implique dans le 
metabolisme intermediate central. 
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De maniere preferee, Pinvention est relative a une sequence nucleotidique selon 
Pinvention, caracterisee en ce qu'elle code pour un polypeptide de Streptococcus 
agalactiae CIP 82.45 (ATCC 12403) ou un de ses fragments implique dans le 
metabolisme energetique. 
5 De maniere preferee, Pinvention est relative a une sequence nucleotidique selon 

Pinvention, caracterisee en ce qu'elle code pour un polypeptide de Streptococcus 
agalactiae CIP 82.45 (ATCC 12403) ou un de ses fragments implique dans le 
metabolisme des acides gras et des phospholipides. 

De maniere preferee, Pinvention est relative a une sequence nucleotidique selon 
10 Pinvention, caracterisee en ce qu'elle code pour un polypeptide de Streptococcus 
agalactiae CIP 82.45 (ATCC 12403) ou un de ses fragments implique dans le 
metabolisme des nucleotides, des purines, des pyrimidines ou nucleosides. 

De maniere preferee, Pinvention est relative a une sequence nucleotidique selon 
Pinvention, caracterisee en ce qu'elle code pour un polypeptide de Streptococcus 
15 agalactiae CIP 82.45 (ATCC 12403) ou un de ses fragments implique dans les 
fonctions de regulation. 

De maniere preferee, Pinvention est relative a une sequence nucleotidique selon 
Pinvention, caracterisee en ce qu'elle code pour un polypeptide de Streptococcus 
agalactiae CIP 82.45 (ATCC 12403) ou un de ses fragments implique dans le processus 
20 de replication. 

De maniere preferee, Pinvention est relative a une sequence nucleotidique selon 
Pinvention, caracterisee en ce qu'elle code pour un polypeptide de Streptococcus 
agalactiae CIP 82.45 (ATCC 12403) ou un de ses fragments implique dans le processus 
de transcription. 

25 De maniere preferee, Pinvention est relative a une sequence nucleotidique selon 

Pinvention, caracterisee en ce qu'elle code pour un polypeptide de Streptococcus 
agalactiae CIP 82.45 (ATCC 12403) ou un de ses fragments implique dans le processus 
de traduction. 

De maniere preferee, Pinvention est relative a une sequence nucleotidique selon 
30 Pinvention, caracterisee en ce qu'elle code pour un polypeptide de Streptococcus 
agalactiae CIP 82.45 (ATCC 12403) ou un de ses fragments implique dans le processus 
de transport et de liaison des proteines. 

De maniere preferee, Pinvention est relative a une sequence nucleotidique selon 
Pinvention, caracterisee en ce qu'elle code pour un polypeptide de Streptococcus 
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agalactiae CIP 82.45 (ATCC 12403) ou un de ses fragments implique dans F adaptation 
aux conditions atypiques. 

De maniere preferee, P invention est relative a une sequence nucleotidique selon 
Finvention, caracterisee en ce qu'elle code pour un polypeptide de Streptococcus 
5 agalactiae CIP 82.45 (ATCC 12403) ou un de ses fragments dans la sensibilite aux 
medicaments et analogues. 

De maniere preferee, Finvention est relative a une sequence nucleotidique selon 
F invention, caracterisee en ce qu'elle code pour un polypeptide de Streptococcus 
agalactiae CIP 82.45 (ATCC 12403) ou un de ses fragments implique dans les 
1 0 fonctions relatives aux transposons. 

De maniere preferee, Finvention est relative a une sequence nucleotidique selon 
Finvention, caracterisee en ce qu'elle code pour un polypeptide specifique de 
Streptococcus agalactiae CIP 82.45 (ATCC 12403) ou un de ses fragments. 

Sous un autre aspect, de maniere preferee, Finvention a pour objet un 
15 polypeptide selon Finvention, caracterise en ce qu'il s'agit d'un polypeptide de 
Streptococcus agalactiae CIP 82.45 (ATCC 12403) ou un de ses fragments implique 
dans la biosynthese des acides amines. 

Sous un autre aspect, de maniere preferee, Finvention a pour objet un 
polypeptide selon Finvention, caracterise en ce qu'il s'agit d'un polypeptide de 
20 Streptococcus agalactiae CIP 82.45 (ATCC 12403) ou un de ses fragments implique 
dans la biosynthese des cofacteurs, groupes prosthetiques et transporters. 

Sous un autre aspect, de maniere preferee, Finvention a pour objet un 
polypeptide selon Finvention, caracterise en ce qu'il s'agit d'un polypeptide 
d'enveloppe cellulaire ou de surface de Streptococcus agalactiae CIP 82.45 (ATCC 
25 12403) ou un de ses fragments. 

Sous un autre aspect, de maniere preferee, Finvention a pour objet un 
polypeptide selon Finvention, caracterise en ce qu'il s'agit d'un polypeptide de 
Streptococcus agalactiae CIP 82.45 (ATCC 12403) ou un de ses fragments implique 
dans la machinerie cellulaire. 
30 Sous un autre aspect, de maniere preferee, Finvention a pour objet un 

polypeptide selon {'invention, caracterise en ce qu'il s'agit d'un polypeptide de 
Streptococcus agalactiae CIP 82.45 (ATCC 12403) ou un de ses fragments implique 
dans le metabolisme intermediaire central. 
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Sous un autre aspect, de maniere preferee, 1' invention a pour objet un 
polypeptide selon F invention, caracterise en ce qu'il s'agit d'un polypeptide de 
Streptococcus agalactiae CIP 82.45 (ATCC 12403) ou un de ses fragments implique 
dans le metabolisme energetique. 
5 Sous un autre aspect, de maniere preferee, Finvention a pour objet un 

polypeptide selon Finvention, caracterise en ce qu'il s'agit d'un polypeptide de 
Streptococcus agalactiae CIP 82.45 (ATCC 12403) ou un de ses fragments implique 
dans le metabolisme des acides gras et des phospholipides. 

Sous un autre aspect, de maniere preferee, Finvention a pour objet un 
10 polypeptide selon Finvention, caracterise en ce qu'il s'agit d'un polypeptide de 
Streptococcus agalactiae CIP 82.45 (ATCC 12403) ou un de ses fragments implique 
dans le metabolisme des nucleotides, des purines, des pyrimidines ou nucleosides. 

Sous un autre aspect, de maniere preferee, Finvention a pour objet un 
polypeptide selon Finvention, caracterise en ce qu'il s'agit d'un polypeptide de 
15 Streptococcus agalactiae CIP 82.45 (ATCC 12403) ou un de ses fragments implique 
dans les fonctions de regulation. 

Sous un autre aspect, de maniere preferee, Finvention a pour objet un 
polypeptide selon Finvention, caracterise en ce qu'il s'agit d'un polypeptide de 
Streptococcus agalactiae CIP 82.45 (ATCC 12403) ou un de ses fragments implique 
20 dans le processus de replication. 

Sous un autre aspect, de maniere preferee, Finvention a pour objet un 
polypeptide selon Finvention, caracterise en ce qu'il s'agit d'un polypeptide de 
Streptococcus agalactiae CIP 82.45 (ATCC 12403) ou un de ses fragments implique 
dans le processus de transcription. 
25 Sous un autre aspect, de maniere preferee, Finvention a pour objet un 

polypeptide selon Finvention, caracterise en ce qu'il s'agit d'un polypeptide de 
Streptococcus agalactiae CIP 82.45 (ATCC 12403) ou un de ses fragments implique 
dans le processus de traduction. 

Sous un autre aspect, de maniere preferee, Finvention a pour objet un 
30 polypeptide selon Finvention, caracterise en ce qu'il s'agit d'un polypeptide de 
Streptococcus agalactiae CIP 82.45 (ATCC 12403) ou un de ses fragments implique 
dans le processus de transport et de liaison des proteines. 

Sous un autre aspect, de maniere preferee, Finvention a pour objet un 
polypeptide selon Finvention, caracterise en ce qu'il s'agit d'un polypeptide de 
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Streptococcus agalactiae CIP 82.45 (ATCC 12403) ou un de ses fragments implique 
dans l'adaptation aux conditions atypiques. 

Sous un autre aspect, de maniere preferee, Finvention a pour objet un 
polypeptide selon Finvention, caracterise en ce qu'il s'agit d'un polypeptide de 
5 Streptococcus agalactiae CIP 82.45 (ATCC 12403) ou un de ses fragments dans la 
sensibilite aux medicaments et analogues. 

Sous un autre aspect, de maniere preferee, Finvention a pour objet un 
polypeptide selon Finvention, caracterise en ce qu'il s'agit d'un polypeptide de 
Streptococcus agalactiae CIP 82.45 (ATCC 12403) ou un de ses fragments implique 
1 0 dans les fonctions relatives aux transposons. 

Sous un autre aspect, de maniere preferee, Finvention a pour objet un 
polypeptide selon Finvention, caracterise en ce qu'il s'agit d'un polypeptide specifique 
de Streptococcus agalactiae CIP 82.45 (ATCC 12403) ou un de ses fragments. 

L'invention a egalement pour objet les operons impliques dans la synthese 
1 5 d'antibiotiques et/ou de toxines. 

Le tableau 1 fournit la liste de certains polypeptides selon Finvention, ainsi que 
leur localisation dans les sequences SEQ ID No. 1 a SEQ ID No. 139, et les analogies 
observees apres comparaison dans les bases de donnees. 

20 II est important de noter toutefois qu'un organisme vivant est un tout et doit etre 

pris comme tel. Ainsi, afin de pouvoir se developper et exhiber ses proprietes, tout 
organisme a besoin d' interactions entre les differentes voies metaboliques. Ainsi, la 
classification enoncee ci-dessus ne doit pas etre consideree comme limitative, un gene 
pouvant etre implique dans deux voies metaboliques distinctes. 

25 La presente invention a egalement pour objet les sequences nucleotidiques et/ou 

de polypeptides selon l'invention, caracterisees en ce que lesdites sequences sont 
enregistrees sur un support d'enregistrement dont la forme et la nature facilitent la 
lecture, Fanalyse et/ou l'exploitation de ladite ou desdites sequence(s). Ces supports 
peuvent egalement contenir d'autres informations extraites de la presente invention, 

30 notamment les analogies avec des sequences deja connues, et/ou des informations 
concernant les sequences nucleotidiques et/ou de polypeptides d'autres micro- 
organismes afin de faciliter Fanalyse comparative et l'exploitation des resultats obtenus. 

Parmi cesdits supports d'enregistrement, on prefere en particulier les supports 
lisibles par un ordinateur, tels les supports magnetiques, optiques, electriques ou 
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hybrides, en particulier les disquettes informatiques, les CD-ROM, les serveurs 
informatiques. De tels supports d'enregistrement sont egalement objet de l'invention. 

Les supports d'enregistrement selon l'invention, avec les informations 
apportees, sont tres utiles pour le choix d' amorces ou de sondes nucleotidiques pour la 
5 determination de genes dans Streptococcus agalactiae CIP 82.45 (ATCC 12403) ou 
souches proches de cet organisme. De meme, 1' utilisation de ces supports pour 1' etude 
du polymorphisme genetique de souches proches de Streptococcus agalactiae CIP 
82.45 (ATCC 12403), en particulier par la determination des regions de colinearite, est 
tres utile dans la mesure ou ces supports fournissent non seulement la sequence 
10 nucleotidique du genome de Streptococcus agalactiae CIP 82.45 (ATCC 12403), mais 
egalement l'organisation genomique dans ladite sequence. Ainsi, les utilisations de 
supports d'enregistrement selon 1'invention sont egalement des objets de l'invention. 

L'analyse d'homologie entre differentes sequences s'effectue en effet 
avantageusement a l'aide de logiciels de comparaison de sequences, tels le logiciel 
1 5 Blast, ou les logiciels de la trousse GCG, decrits precedemment. 

L'invention vise egalement les vecteurs de clonage et/ou d'expression, qui 
contiennent une sequence nucleotidique selon l'invention. 

Les vecteurs selon l'invention comportent de preference des elements qui 
permettent 1' expression et/ou la secretion des sequences nucleotidiques dans une cellule 
20 hote determinee. 

Le vecteur doit alors comporter un promoteur, des signaux d' initiation et de 
terminaison de la traduction, ainsi que des regions appropriees de regulation de la 
transcription. II doit pouvoir etre maintenu de fa(?on stable dans la cellule hote et peut 
eventuellement posseder des signaux particuliers qui specifient la secretion de la 
25 proteine traduite. Ces differents elements sont choisis et optimises par l'homme du 
metier en fonction de l'hote cellulaire utilise. A cet effet, les sequences nucleotidiques 
selon l'invention peuvent etre inserees dans des vecteurs a replication autonome au sein 
de l'hote choisi, ou etre des vecteurs integratifs de l'hote choisi. 

De tels vecteurs sont prepares par des methodes couramment utilisees par 
30 l'homme du metier, et les clones resultant peuvent etre introduits dans un hote approprie 
par des methodes standards, telles que la lipofection, l'electroporation, le choc 
thermique, ou des methodes chimiques. 
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Les vecteurs selon Pinvention sont par exemple des vecteurs d'origine 
plasmidique ou virale. lis sont utiles pour transformer des cellules hotes afin de cloner 
ou d'exprimer les sequences nucleotidiques selon Pinvention. 

L' invention comprend egalement les cellules hotes transformees par un vecteur 
5 selon Pinvention. 

L'hote cellulaire peut etre choisi parmi des systemes procaryotes ou eucaryotes, 
par exemple les cellules bacteriennes mais egalement les cellules de levure ou les 
cellules animates, en particulier les cellules de mammiferes. On peut egalement utiliser 
des cellules d'insectes ou des cellules de plantes. Les cellules hotes preferees selon 
10 Pinvention sont en particulier les cellules procaryotes, de preference les bacteries 
appartenant au genre Streptococcus, a Pespece Streptococcus agalactiae, plus 
particulierement Streptococcus agalactiae CIP 82.45 (ATCC 12403), ou les micro- 
organismes associes a Pespece Streptococcus agalactiae. 

L'invention concerne egalement les vegetaux et les animaux, excepte Phomme, 
15 qui comprennent une cellule transformee selon Pinvention. Les cellules transformees 
selon Pinvention sont utilisables dans des procedes de preparation de polypeptides 
recombinants selon Pinvention. Les procedes de preparation d'un polypeptide selon 
Pinvention sous forme recombinante, caracterises en ce qu'ils mettent en oeuvre un 
vecteur et/ou une cellule transformee par un vecteur selon Pinvention sont eux-memes 
20 compris dans la presente invention. De preference, on cultive une cellule transformee 
par un vecteur selon Pinvention dans des conditions qui permettent P expression dudit 
polypeptide et on recupere ledit peptide recombinant. 

Ainsi qu'il a ete dit, Phote cellulaire peut etre choisi parmi des systemes 
procaryotes ou eucaryotes. En particulier, il est possible d' identifier des sequences 
25 nucleotidiques selon Pinvention, facilitant la secretion dans un tel systeme procaryote 
ou eucaryote. Un vecteur selon Pinvention portant une telle sequence peut done etre 
avantageusement utilise pour la production de proteines recombinantes, destinees a etre 
secretees. En effet, la purification de ces proteines recombinantes d'interet sera facilitee 
par le fait qu'elles sont presentent dans le surnageant de la culture cellulaire plutot qu'a 
30 Pinterieur des cellules hotes. 

On peut egalement preparer les polypeptides selon Pinvention par synthese 
chimique. Un tel procede de preparation est egalement un objet de Pinvention. 
L'homme du metier connait les procedes de synthese chimique, par exemple les 
techniques mettant en oeuvre des phases solides (voir notamment Steward et al., 1984, 
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Solid phase peptides synthesis, Pierce Chem. Company, Rockford, 111, 2eme ed., 
(1984)) ou des techniques utilisant des phases solides partielles, par condensation de 
fragments ou par une synthese en solution classique. Les polypeptides obtenus par 
synthese chimique et pouvant comporter des acides amines non naturels correspondants 
5 sont egalement compris dans l'invention. 

L'invention est en outre relative a des polypeptides hybrides presentant au moins 
un polypeptide ou un de ses fragments selon l'invention, et une sequence d'un 
polypeptide susceptible d'induire une reponse immunitaire chez Phomme ou 1' animal. 

Avantageusement, le determinant antigenique est tel qu'il est susceptible 
1 0 d'induire une reponse humorale et/ou cellulaire. 

Un tel determinant pourra comprendre un polypeptide ou un de ses fragments 
selon l'invention sous forme glycosylee, utilise en vue d'obtenir des compositions 
immunogenes susceptibles d'induire la synthese d'anticorps diriges contre des epitopes 
multiples. Lesdits polypeptides ou leurs fragments glycosyles font egalement partie de 
15 l'invention. 

Ces molecules hybrides peuvent etre constitutes en partie d'une molecule 
porteuse de polypeptides ou de leurs fragments selon l'invention, associee a une partie 
eventuellement immunogene, en particulier un epitope de la toxine diphterique, la 
toxine tetanique, un antigene de surface du virus de 1'hepatite B (brevet FR 79 2181 1), 
20 l'antigene VP1 du virus de la poliomyelite ou toute autre toxine ou antigene viral ou 
bacterien. 

Les precedes de synthese des molecules hybrides englobent les methodes 
utilisees en genie genetique pour construire des sequences nucleotidiques hybrides 
codant pour les sequences polypeptidiques recherchees. On pourra, par exemple, se 
25 referer avantageusement a la technique d'obtention de genes codant pour des proteines 
de fusion decrite par Minton en 1984. 

Lesdites sequences nucleotidiques hybrides codant pour un polypeptide hybride 
ainsi que les polypeptides hybrides selon l'invention, caracterises en ce qu'il s'agit de 
polypeptides recombinants obtenus par l'expression desdites sequences nucleotidiques 
30 hybrides, font egalement partie de l'invention. 

L'invention comprend egalement les vecteurs caracterises en ce qu'ils 
contiennent une desdites sequences nucleotidiques hybrides. Les cellules hotes 
transformees par lesdits vecteurs, les animaux transgeniques comprenant une desdites 
cellules transformees ainsi que les procedes de preparation de polypeptides 
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recombinants utilisant lesdits vecteurs, lesdites cellules transformees et/ou lesdits 
animaux transgeniques font egalement partie de P invention. 

Le couplage entre un polypeptide selon P invention et un polypeptide 
immunogene peut etre effectue par voie chimique, ou par voie biologique. Ainsi, selon 
5 Pinvention, il est possible d'introduire un ou plusieurs element(s) de liaison, notamment 
des acides amines pour faciliter les reactions de couplage entre le polypeptide selon 
Pinvention, et le polypeptide immunostimulateur, le couplage covalent de Pantigene 
immunostimulateur pouvant etre realise a Pextremite N ou C-terminale du polypeptide 
selon Pinvention. Les reactifs bifonctionnels permettant ce couplage sont determines en 

10 fonction de Pextremite choisie pour realiser ce couplage, et les techniques de couplage 
sont bien connues de Phomme du metier. 

Les conjugues issus d'un couplage de peptides peuvent etre egalement prepares 
par recombinaison genetique. Le peptide hybride (conjugue) peut en effet etre produit 
par des techniques d'ADN recombinant, par insertion ou addition a la sequence d'ADN 

15 codant pour le polypeptide selon Pinvention, d'une sequence codant pour le ou les 
peptide(s) antigene(s), immunogene(s) ou haptene(s). Ces techniques de preparation de 
peptides hybrides par recombinaison genetique sont bien connues de Phomme du metier 
(voir par exemple Makrides, 1996, Microbiological Reviews 50,512-538). 

De preference, ledit polypeptide immunitaire est choisi dans le groupe des 

20 peptides contenant les anatoxines, notamment le toxoide diphterique ou le toxoYde 
tetanique, les proteines derivees du Streptocoque (comme la proteine de liaison a la 
seralbumine humaine), les proteines membranaires OMPA et les complexes de 
proteines de membranes externes, les vesicules de membranes externes ou les proteines 
de chocs thermiques. 

25 Les polypeptides hybrides selon Pinvention sont tres utiles pour obtenir des 

anticorps monoclonaux ou polyclonaux, capables de reconnaitre specifiquement les 
polypeptides selon Pinvention. En effet, un polypeptide hybride selon Pinvention 
permet la potentialisation de la reponse immunitaire, contre le polypeptide selon 
Pinvention couple a la molecule immunogene. De tels anticorps monoclonaux ou 

30 polyclonaux, leurs fragments, ou les anticorps chimeriques, reconnaissant les 
polypeptides selon Pinvention, sont egalement objet de Pinvention. 

Les anticorps monoclonaux specifiques peuvent etre obtenus selon la methode 
classique de culture d'hybridome decrite par Kohler et Milstein (1975, Nature 256, 
495). 
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Les anticorps selon 1' invention sont par exemple des anticorps chimeriques, des 
anticorps humanises, des fragments Fab, ou F(ab') 2 . lis peuvent egalement se presenter 
sous forme d'immunoconjugues ou d'anticorps marques afin d'obtenir un signal 
detectable et/ou quantifiable. 
5 Ainsi, les anticorps selon Finvention peuvent etre employes dans un procede 

pour la detection et/ou F identification de bacteries appartenant a Fespece Streptococcus 
agalactiae ou a un micro-organisme associe dans un echantillon biologique, caracterise 
en ce qu'il comprend les etapes suivantes: 

a) mise en contact de Fechantillon biologique avec un anticorps selon Finvention ; 

10 b) mise en evidence du complexe antigene-anticorps eventuellement forme. 

Les anticorps selon la presente invention sont egalement utilisables afin de 
detecter une expression d'un gene de Streptococcus agalactiae ou de micro-organismes 
associes. En effet, la presence du produit d' expression d'un gene reconnu par un 
anticorps specifique dudit produit d'expression peut etre detectee par la presence d'un 

15 complexe antigene-anticorps forme apres la mise en contact de la souche de 
Streptococcus agalactiae ou du micro-organisme associe avec un anticorps selon 
Finvention. La souche bacterienne utilisee peut avoir ete « preparee », c'est-a-dire 
centrifugee, lysee, placee dans un reactif approprie pour la constitution du milieu 
propice a la reaction immunologique. En particulier, on prefere un procede de detection 

20 de F expression dans le gene, correspondant a un Western blot, pouvant etre effectue 
apres une electrophorese sur gel de polyacrylamide d'un lysat de la souche bacterienne, 
en presence ou en F absence de conditions reductrices (SDS-PAGE). Apres migration et 
separation des proteines sur le gel de polyacrylamide, on transfere lesdites proteines sur 
une membrane appropriee (par exemple en nylon) et on detecte la presence de la 

25 proteine ou du polypeptide d'interet, par mise en contact de ladite membrane avec un 
anticorps selon Finvention. 

Ainsi, la presente invention comprend egalement les kits ou necessaires pour la 
mise en oeuvre d'un procede tel que decrit (de detection de l'expression d'un gene de 
Streptococcus agalactiae ou d'un micro-organisme associe, ou pour la detection et/ou 

30 F identification de bacteries appartenant a Fespece Streptococcus agalactiae ou un 
micro-organisme associe), comprenant les elements suivants : 

a) un anticorps polyclonal ou monoclonal selon Finvention ; 

b) eventuellement, les reactifs pour la constitution du milieu propice a la reaction 
immunologique ; 
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c) eventuellement, les reactifs permettant la mise en evidence des complexes antigene- 
anticorps produits par la reaction immunologique. 

Les polypeptides et les anticorps selon 1' invention peuvent avantageusement etre 
immobilises sur un support, notamment une puce a proteines. Une telle puce a proteines 
5 est un objet de Pinvention, et peut egalement contenir au moins un polypeptide d'un 
micro-organisme autre que Streptococcus agalactiae CIP 82.45 (ATCC 12403) ou un 
anticorps dirige contre un compose d'un micro-organisme autre que Streptococcus 
agalactiae CIP 82.45 (ATCC 12403). 

Les puces a proteines ou filtres a haute densite contenant des proteines selon 
10 P invention peuvent etre construites de la meme maniere que les puces a ADN selon 
Pinvention. En pratique, on peut effectuer la synthese des polypeptides directement 
fixes sur la puce a proteines, ou effectuer une synthese ex situ suivie d'une etape de 
fixation sur ladite puce du polypeptide synthetise. Cette derniere methode est preferable, 
lorsque Pon desire fixer des proteines de taille importante sur le support, ces proteines 
1 5 etant avantageusement preparees par genie genetique. Toutefois, si Pon ne desire fixer 
que des peptides sur le support de ladite puce, il peut etre plus interessant de proceder a 
la synthese desdits peptides directement in situ. 

Les puces a proteines selon Pinvention peuvent etre avantageusement utilisees 
dans des kits ou necessaires pour la detection et/ou P identification de bacteries 
20 associees a Pespece Streptococcus agalactiae CIP 82.45 (ATCC 12403) ou a un micro- 
organisme, ou de fa?on plus generate dans des kits ou necessaires pour la detection 
et/ou P identification de micro-organismes. Lorsque Pon fixe les polypeptides selon 
Pinvention sur les puces a ADN, on recherche la presence d'anticorps dans les 
echantillons testes, la fixation d'un anticorps selon Pinvention sur le support de la puce 
25 a proteines permettant P identification de la proteine dont ledit anticorps est specifique. 

De preference, on fixe un anticorps selon Pinvention sur le support de la puce a 
proteines, et on detecte la presence de Pantigene correspondant, specifique de 
Streptococcus agalactiae CIP 82.45 (ATCC 12403) ou d'un micro-organisme associe. 

Une puce a proteines ci-dessus decrite peut etre utilisee pour la detection de 
30 produits de genes, pour etablir un profil d' expression desdits genes, en complement 
d'une puce a ADN selon Pinvention. 

Les puces a proteines selon Pinvention sont egalement extremement utiles pour 
les experiences de proteomique, qui etudie les interactions entre les differentes proteines 
d'un micro-organisme donne. De fa<?on simplifiee, on fixe des peptides representatifs 
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des differentes proteines d'un organisme sur un support. Puis, on met ledit support en 
contact avec des proteines marquees, et apres une etape optionnelle de rin9age, on 
detecte des interactions entre Iesdites proteines marquees et les peptides fixes sur la 
puce a proteines. 

5 Ainsi, les puces a proteines comprenant une sequence polypeptidique selon 

T invention ou un anticorps selon V invention sont objet de 1' invention, ainsi que les kits 
ou necessaires les contenant. 

La presente invention couvre egalement un procede de detection et/ou 
d' identification de bacteries appartenant a Fespece Streptococcus agalactiae CIP 82.45 
10 (ATCC 12403) ou a un micro-organisme associe dans un echantillon biologique, qui 
met en oeuvre une sequence nucleotidique selon l'invention. 

II doit etre entendu que le terme echantillon biologique concerne dans la 
presente invention les echantillons preleves a partir d'un organisme vivant (en 
particulier sang, tissus, organes ou autres preleves a partir d'un mammifere) ou un 
15 echantillon contenant du materiel biologique, c'est-a-dire de l'ADN ou de TARN. Un 
tel echantillon biologique comprend aussi les compositions alimentaires contenant des 
bacteries (par exemple les fromages, les produits laitiers), mais egalement des 
compositions alimentaires contenant des levures (bieres, pains) ou autres. Le terme 
echantillon biologique concerne aussi les bacteries isolees a partir de ces prelevements 
20 ou compositions alimentaires. 

Le procede de detection et/ou d' identification mettant en ceuvre les sequences 
nucleotidiques selon l'invention peut etre de diverse nature. 

On prefere un procede comportant les etapes suivantes : 

a) eventuellement, isolement de TADN a partir de l'echantillon biologique a analyser, 
25 ou obtention d'un ADNc a partir de l'ARN de l'echantillon biologique ; 

b) amplification specifique de l'ADN de bacteries appartenant a l'espece Streptococcus 
agalactiae CIP 82.45 (ATCC 12403) ou a un micro-organisme associe a 1'aide d'au 
moins une amorce selon l'invention ; 

c) mise en evidence des produits d'amplification. 

30 Ce procede est base sur 1' amplification specifique de l'ADN, en particulier par 

une reaction d'amplification en chaine. 

On prefere egalement un procede comprenant les etapes suivantes : 
a) mise en contact d'une sonde nucleotidique selon l'invention avec un echantillon 
biologique, l'acide nucleique contenu dans l'echantillon biologique ayant, le cas 
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echeant, prealablement ete rendu accessible a 1' hybridation, dans des conditions 
permettant F hybridation de la sonde a Facide nucleique d'une bacterie appartenant a 
Fespece Streptococcus agalactiae CIP 82.45 (ATCC 12403) ou a un micro- 
organisme associe ; 

5 b) mise en evidence de Fhybride eventuellement forme entre la sonde nucleotidique et 
FADN de Fechantillon biologique. 

Un tel procede ne doit pas etre limite a la detection de la presence de FADN 
contenu dans Fechantillon biologique a tester, il peut etre egalement mis en oeuvre pour 
detecter TARN contenu dans ledit echantillon. Ce procede englobe en particulier les 
1 0 Southern et Northern blot. 

Un autre procede prefere selon F invention comprend les etapes suivantes : 

a) mise en contact d'une sonde nucleotidique immobilisee sur un support selon 
Finvention avec un echantillon biologique, Facide nucleique de Fechantillon, ayant, 
le cas echeant, ete prealablement rendu accessible a F hybridation, dans des 

15 conditions permettant Fhybridation de la sonde a Facide nucleique d'une bacterie 

appartenant a Fespece Streptococcus agalactiae CIP 82.45 (ATCC 12403) ou a un 
micro-organisme associe ; 

b) mise en contact de Fhybride forme entre la sonde nucleotidique immobilisee sur un 
support et Facide nucleique contenu dans Fechantillon biologique, le cas echeant 

20 apres elimination de FADN de Fechantillon biologique n'ayant pas hybride avec la 

sonde, avec une sonde nucleotidique marquee selon Finvention ; 

c) mise en evidence du nouvel hybride forme a Fetape b). 

Ce procede est avantageusement utilise avec une puce a ADN selon Finvention, 

Facide nucleique recherche s'hybridant avec une sonde presente a la surface de ladite 
25 puce, et etant detecte par Futilisation d'une sonde marquee. Ce procede est 

avantageusement mis en oeuvre en combinant une etape prealable d' amplification de 

FADN ou de FADN complementaire obtenu eventuellement par transcription inverse, a 

Faide d'amorces selon Finvention. 

Ainsi, la presente invention englobe egalement les kits ou necessaires pour la 
30 detection et/ou F identification de bacteries appartenant a Fespece Streptococcus 

agalactiae CIP 82.45 (ATCC 12403) ou a un micro-organisme associe, caracterise en ce 

qu'il comprend les elements suivants : 

a) une sonde nucleotidique selon Finvention ; 
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b) eventuellement, les reactifs necessaires a la mise en oeuvre d'une reaction 
d' hybridation ; 

c) eventuellement, au moins une amorce selon P invention ainsi que les reactifs 
necessaires a une reaction d'amplification de P ADN. 

5 De meme, la presente invention englobe egalement les kits ou necessaires pour 

la detection et/ou 1' identification de bacteries appartenant a Pespece Streptococcus 
agalactiae CIP 82.45 (ATCC 12403) ou a un micro-organisme associe, caracterise en ce 
qu'il comprend les elements suivants : 

a) une sonde nucleotidique, dite sonde de capture, selon 1' invention ; 
10 b) une sonde oligonucleotidique, dite sonde de revelation, selon Pinvention ; 

c) eventuellement, au moins une amorce selon Pinvention ainsi que les reactifs 
necessaires a une reaction d'amplification de PADN. 

Enfin, les kits ou necessaires pour la detection et/ou P identification de bacteries 
appartenant a Pespece Streptococcus agalactiae CIP 82.45 (ATCC 12403) ou a un 
1 5 micro-organisme associe, caracterise en ce qu'il comprend les elements suivants : 

a) au moins une amorce selon Pinvention ; 

b) eventuellement, les reactifs necessaires pour effectuer une reaction d'amplification 
d'ADN ; 

c) eventuellement, un composant permettant de verifier la sequence du fragment 
20 amplifie, plus particulierement une sonde oligonucleotidique selon Pinvention, 

sont egalement objet de la presente invention. 

De preference, lesdites amorces et/ou sondes et/ou polypeptides et/ou anticorps 
selon la presente invention utilises dans les procedes et/ou kits ou necessaires selon la 
presente invention sont choisis parmi les amorces et/ou sondes et/ou polypeptides et/ou 
25 anticorps specifiques de Pespece Streptococcus agalactiae CIP 82.45 (ATCC 12403). 
De maniere preferee, ces elements sont choisis parmi les sequences nucleotidiques 
codant pour une proteine secretee, parmi les polypeptides secretes, ou parmi les 
anticorps diriges contre des polypeptides secretes de Streptococcus agalactiae CIP 
82.45 (ATCC 12403). 

30 La presente invention a egalement pour objet les souches de Streptococcus 

agalactiae CIP 82.45 (ATCC 12403) et/ou de micro-organismes associes contenant une 
ou plusieurs mutation(s) dans une sequence nucleotidique selon Pinvention, en 
particulier une sequence ORF, ou leurs elements regulateurs (en particulier promoteurs). 
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On prefere, selon la presente invention, les souches de Streptococcus agalactiae 
CIP 82.45 (ATCC 12403) presentant une ou plusieurs mutation(s) dans les sequences 
nucleotidiques codant pour des polypeptides impliques dans la machinerie cellulaire, en 
particulier la secretion, le metabolisme intermediaire central, le metabolisme 
5 energetique, les processus de synthese des acides amines, de transcription et de 
traduction, de synthese des polypeptides. 

Lesdites mutations peuvent mener a une inactivation du gene, ou en particulier 
lorsqu'elles sont situees dans les elements regulateurs dudit gene, a une surexpression 
de celui-ci. 

10 L' invention concerne en outre Putilisation d'une sequence nucleotidique selon 

Pinvention, d'un polypeptide selon l'invention, d'un anticorps selon l'invention, d'une 
cellule selon l'invention, et/ou d'un animal transforme selon l'invention, pour la 
selection de compose organique ou inorganique capable de moduler, de reguler, 
d'induire ou d'inhiber l'expression de genes, et/ou de modifier la replication cellulaire 

15 de cellules eucaryotes ou procaryotes ou capables d'induire, d'inhiber ou d'aggraver 
une pathologies liees a une infection par Streptococcus agalactiae ou un de ses micro- 
organismes associes. 

L'invention comprend egalement une methode de selection de composes 
capables de se lier a un polypeptide ou un de ses fragments selon l'invention, capables 

20 de se lier a une sequence nucleotidique selon l'invention, ou capables de reconnaitre un 
anticorps selon l'invention, et/ou capables de moduler, de reguler, d'induire ou d'inhiber 
l'expression de genes, et/ou de modifier la croissance ou la replication cellulaire de 
cellules eucaryotes ou procaryotes, ou capables d'induire, d'inhiber ou d'aggraver chez 
un organisme animal ou humain une pathologie liee a une infection par Streptococcus, 

25 par exemple par Streptococcus agalactiae, ou un de ses micro-organismes associes, 
caracterisee en ce qu'elle comprend les etapes suivantes : 

a) mise en contact dudit compose avec ledit polypeptide, ladite sequence nucleotidique, 
avec une cellule transformee selon l'invention et/ou administration dudit compose a 
un animal transforme selon l'invention ; 
30 b) determination de la capacite dudit compose a se lier avec ledit polypeptide ou ladite 
sequence nucleotidique, ou de moduler, de reguler, d'induire ou d'inhiber 
l'expression de genes, ou de moduler la croissance ou la replication cellulaire, ou 
d'induire, d'inhiber ou d'aggraver chez ledit animal transforme les pathologies liees 
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a une infection par Streptococcus, par exemple Streptococcus agalactiae ou un de ses 
micro-organismes associes. 

Les cellules et/ou les animaux transformes selon 1' invention, pourront 
avantageusement servir de modele et etre utilises dans des procedes pour etudier, 
5 identifier et/ou selectionner des composes susceptibles d'etre responsables de 
pathologies induites ou aggravees par Streptococcus agalactiae, ou susceptibles de 
prevenir et/ou de traiter ces pathologies. En particulier, les cellules hotes transformees, 
notamment les bacteries de la famille des Streptococcus dont la transformation par un 
vecteur selon Finvention peut par exemple accroitre ou inhiber son pouvoir infectieux, 
10 ou moduler les pathologies habituellement induites ou aggravees par 1' infection, 
pourront etre utilisees pour infecter des animaux dont on suivra l'apparition des 
pathologies. Ces animaux non transformes, infectes par exemple avec des bacteries 
Streptococcus transformees, pourront servir de modele d'etude. De la meme maniere, 
les animaux transformes selon 1' invention pourront etre utilises dans des procedes de 
15 selection de composes susceptibles de prevenir et/ou de traiter les maladies dues a 
Streptococcus. Lesdits procedes utilisant lesdites cellules transformees et/ou animaux 
transformes, font partie de Finvention. 

Les composes susceptibles d'etre selectionnes peuvent etre des composes 
organiques tels que des polypeptides ou hydrates de carbone ou tous autres composes 
20 organiques ou inorganiques deja connus, ou des composes organiques nouveaux 
elabores a partir de techniques de modelisation moleculaire et obtenus par synthese 
chimique ou biochimique, ces techniques etant connues de l'homme de Tart. 

Lesdits composes selectionnes pourront etre utilises pour moduler la croissance 
et/ou la replication cellulaire de Streptococcus agalactiae ou tout autre micro-organisme 
25 associe et ainsi pour controler F infection par ces micro-organismes. Lesdits composes 
selon Finvention pourront egalement etre utilises pour moduler la croissance et/ou la 
replication cellulaire de toutes cellules eucaryotes ou procaryotes, notamment les 
cellules tumorales et les micro-organismes infectieux, pour lesquelles lesdits composes 
s'avereront actifs, les methodes permettant de determiner lesdites modulations etant 
30 bien connues de Fhomme de Fart. 

On entend designer par compose capable de moduler la croissance d'un micro- 
organisme tout compose permettant d'intervenir, de modifier, de limiter et/ou de reduire 
le developpement, la croissance, la vitesse de proliferation et/ou la viabilite dudit micro- 
organisme. 
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Cette modulation peut etre realisee par exemple par un agent capable de se lier a 
une proteine et ainsi d'inhiber ou de potentialiser son activite biologique, ou capable de 
se lier a une proteine membranaire de la surface exterieure d'un micro-organisme et de 
bloquer la penetration dudit micro-organisme dans la cellule hote ou de favoriser 
5 Taction du systeme immunitaire de l'organisme infecte dirige a l'encontre dudit micro- 
organisme. Cette modulation peut etre egalement realisee par un agent capable de se lier 
a une sequence nucleotidique d'un ADN ou ARN d'un micro-organisme et de bloquer 
par exemple I'expression d'un polypeptide dont F activite biologique ou structurelle est 
necessaire a la croissance ou a la reproduction dudit micro-organisme. 

1 0 On entend designer par micro-organisme associe dans la presente invention, tout 

micro-organisme dont I'expression de gene peut etre modulee, regulee, induite ou 
inhibee, ou dont la croissance ou la replication cellulaire peut etre egalement modulee 
par un compose de l'invention. On entend designer egalement par micro-organisme 
associe dans la presente invention, tout micro-organisme comportant des sequences 

15 nucleotidiques ou des polypeptides selon Finvention. Ces micro-organismes peuvent 
dans certains cas comporter des polypeptides ou des sequences nucleotidiques 
identiques ou homologues a celles de l'invention et pourront egalement etre detectes 
et/ou identifies par les precedes ou kit de detection et/ou d' identification selon 
Finvention et egalement servir de cible pour les composes de l'invention. On entend 

20 aussi designer par micro-organisme tout micro-organisme Streptococcus agalactiae de 
tout serotype. 

L'invention concerne les composes susceptibles d'etre selectionnes par une 
methode de selection selon Finvention. 

L'invention concerne egalement une composition pharmaceutique comprenant 
25 un compose choisi parmi les composes suivants : 

a) une sequence nucleotidique selon Finvention ; 

b) un polypeptide selon l'invention ; 

c) un vecteur selon l'invention ; 

d) un anticorps selon Finvention ; et 

30 e) un compose susceptible d'etre selectionne par une methode de selection selon 
Finvention, 

eventuellement en association avec un vehicule pharmaceutiquement acceptable. 
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La presente invention concerne en outre une composition pharmaceutique selon 
l'invention pour la prevention et le traitement d'une infection par une bacterie 
appartenant a l'espece Streptococcus agalactiae. 

La presente invention concerne en outre une composition pharmaceutique selon 
5 l'invention, caracterisee en ce qu'elle comprend des anticorps diriges contre les 
polypeptides specifiques de Streptococcus agalactiae. 

On entend designer par quantite efficace, une quantite suffisante dudit compose 
ou anticorps, ou de polypeptide de l'invention, permettant de moduler la croissance de 
Streptococcus agalactiae ou d'un micro-organisme associe. 
10 L'invention concerne aussi une composition pharmaceutique selon l'invention 

pour la prevention ou le traitement d'une infection par une bacterie appartenant au genre 
Streptococcus ou par un micro-organisme associe. 

L'invention vise en outre une composition immunogene et/ou vaccinale, 
caracterisee en ce qu'elle comprend un ou plusieurs polypeptides selon l'invention et/ou 
15 un ou plusieurs polypeptides hybrides selon l'invention. 

L'invention comprend aussi Putilisation d'une cellule transformee selon 
l'invention, pour la preparation d'une composition vaccinale. 

L'invention vise egalement une composition vaccinale, caracterisee en ce qu'elle 
contient une sequence nucleotidique selon l'invention, un vecteur selon l'invention 
20 et/ou une cellule transformee selon l'invention. 

L'invention concerne en outre une composition immunogene capable d'induire 
une reponse immunitaire cellulaire ou humorale pour la prevention ou le traitement 
d'une infection par une bacterie appartenant a l'espece Streptococcus agalactiae, 
caracterisee en ce qu'elle comprend une composition immunogene ou une composition 
25 vaccinale selon l'invention, en association avec un vehicule pharmaceutiquement 
acceptable et eventuellement un ou plusieurs adjuvants de l'immunite appropries. 

L'invention concerne egalement les compositions vaccinales selon l'invention, 
pour la prevention ou le traitement d'une infection par une bacterie appartenant au genre 
Streptococcus ou par un micro-organisme associe. 
30 De maniere preferee, les compositions immunogenes et/ou vaccinales selon 

l'invention destinees a la prevention et/ou au traitement d'infection par Streptococcus ou 
par un micro-organisme associe seront choisies parmi les compositions immunogenes 
et/ou vaccinales comprenant un polypeptide ou un de ses fragments correspondant a une 
proteine, ou un de ses fragments, de Penveloppe cellulaire de Streptococcus. Les 
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compositions vaccinales comprenant des sequences nucleotidiques comprendront de 
preference egalement des sequences nucleotidiques codant pour un polypeptide ou un 
de ses fragments correspondant a une proteine, ou un de ses fragments, de Penveloppe 
cellulaire de Streptococcus. 
5 Les polypeptides de Tinvention ou leurs fragments entrant dans les compositions 

immunogenes selon l'invention peuvent etre selectionnes par des techniques connues de 
Thomme de Tart comme par exemple sur la capacite desdits polypeptides a stimuler les 
cellules T, qui se traduit par exemple par leur proliferation ou la secretion 
d'interleukines, ou qui aboutit a la production d'anticorps diriges contre lesdits 
1 0 polypeptides. 

Chez la souris, chez laquelle une dose ponderale de la composition vaccinale 
comparable a la dose utilisee chez Thomme est administree, la reaction anticorps est 
testee par prelevement du serum suivi d'une etude de la formation d'un complexe entre 
les anticorps presents dans le serum et Pantigene de la composition vaccinale, selon les 

1 5 techniques usuelles. 

Selon F invention, lesdites compositions vaccinales seront de preference en 
association avec un vehicule pharmaceutiquement acceptable et, le cas echeant, avec un 
ou plusieurs adjuvants de Fimmunite appropries. 

Aujourd'hui, divers types de vaccins sont disponibles pour proteger Fhomme 

20 contre des maladies infectieuses : micro-organismes vivants attenues (M bovis - BCG 
pour la tuberculose), micro-organismes inactives (virus de la grippe), des extraits 
acellulaires (Bordetella pertussis pour la coqueluche), proteines recombinees (antigene 
de surface du virus de Fhepatite B), des polyosides (pneumocoques). Des vaccins 
prepares a partir de peptides de synthese ou de micro-organismes genetiquement 

25 modifies exprimant des antigenes heterologues sont en cours d' experimentation. Plus 
recemment encore, des ADNs plasmidiques recombines portant des genes codant pour 
des antigenes protecteurs ont ete proposes comme strategic vaccinale alternative. Ce 
type de vaccination est realise avec un plasmide particulier derivant d'un plasmide de 
E. coli qui ne se replique pas in vivo et qui code uniquement pour la proteine vaccinante. 

30 Des animaux ont ete immunises en injectant simplement FADN plasmidique nu dans le 
muscle. Cette technique conduit a Fexpression de la proteine vaccinale in situ et a une 
reponse immunitaire de type cellulaire (CTL) et de type humoral (anticorps). Cette 
double induction de la reponse immunitaire est Fun des principaux avantages de la 
technique de vaccination avec de FADN nu. 
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Les compositions vaccinales comprenant des sequences nucleotidiques ou des 
vecteurs dans lesquels sont inserees lesdites sequences, sont notamment decrites dans la 
demande internationale N° WO 90/11092 et egalement dans la demande internationale 
N° WO 95/11307. 

5 La sequence nucleotidique constitutive de la composition vaccinale selon 

Tinvention peut etre injectee a Thote apres avoir ete couplee a des composes qui 
favorisent la penetration de ce polynucleotide a Tinterieur de la cellule ou son transport 
jusqu'au noyau cellulaire. Les conjugues resultants peuvent etre encapsules dans des 
microparticules polymeres, comme decrit dans la demande internationale N° WO 

1 0 94/27238 (Medisorb Technologies International). 

Selon un autre mode de realisation de la composition vaccinale selon 
Tinvention, la sequence nucleotidique, de preference un ADN, est complexee avec du 
DEAE-dextran, avec des proteines nucleaires, avec des lipides ou encapsulee dans des 
liposomes ou encore introduite sous la forme d'un gel facilitant sa transfection dans les 

1 5 cellules. Le polynucleotide ou le vecteur selon Tinvention peut aussi etre en suspension 
dans une solution tampon ou etre associe a des liposomes. 

Avantageusement, un tel vaccin sera prepare conformement a la technique 
decrite par Tacson et al. ou Huygen et al. en 1996 ou encore conformement a la 
technique decrite par Davis et al. dans la demande internationale N° WO 95/1 1307. 

20 Un tel vaccin peut etre egalement prepare sous la forme d'une composition 

contenant un vecteur selon Tinvention, placee sous le controle d'elements de regulation 
permettant son expression chez Thomme ou Tanimal. On pourra par exemple utiliser, en 
tant que vecteur d 5 expression in vivo de Tantigene polypeptidique d'interet, le plasmide 
pcDNA3 ou le plasmide pcDNAl/neo, tous les deux commercialises par Invitrogen (R 

25 & D Systems, Abingdon, Royaume-Uni). Un tel vaccin comprendra avantageusement, 
outre le vecteur recombinant, une solution saline, par exemple une solution de chlorure 
de sodium. 

On entend designer par vehicule pharmaceutiquement acceptable, un compose 
ou une combinaison de composes entrant dans une composition pharmaceutique ou 
30 vaccinale ne provoquant pas de reactions secondaires et qui permet par exemple la 
facilitation de Tadministration du compose actif, Taugmentation de sa duree de vie et/ou 
de son efficacite dans l'organisme, Taugmentation de sa solubilite en solution ou encore 
T amelioration de sa conservation. Ces vehicules pharmaceutiquement acceptables sont 



WO 02/092818 



40 



PCT/IB02/03059 



bien connus et seront adaptes par rhomme de Tart en fonction de la nature et du mode 
d'administration du compose actif choisi. 

En ce qui concerne les formulations vaccinales, celles-ci peuvent comprendre 
des adjuvants de l'immunite appropries qui sont connus de rhomme de Tart, comme par 
5 exemple Miydroxyde d'aluminium, un representant de la famille des muramyl peptides 
comme un des derives peptidiques du N-acetyl-muramyl, un lysat bacterien, ou encore 
F adjuvant incomplet de Freund. 

De preference, ces composes seront administres par voie systemique, en 
particulier par voie intraveineuse, par voie intramusculaire, intradermique ou sous- 
10 cutanee, ou par voie orale. De maniere plus preferee, la composition vaccinale 
comprenant des polypeptides selon T invention, sera administree a plusieurs reprises, de 
maniere etalee dans le temps, par voie intradermique ou sous-cutanee. 

Leurs modes d' administration, posologies et formes galeniques optimaux 
peuvent etre determines selon les criteres generalement pris en compte dans 
15 Fetablissement d'un traitement adapte a un patient comme par exemple Fage ou le 
poids corporel du patient, la gravite de son etat general, la tolerance au traitement et les 
effets secondaires constates. 

Enfin, Finvention comprend Futilisation d'une composition selon Finvention, 
pour le traitement ou la prevention de maladies induites ou aggravees par la presence de 
20 Streptococcus. 

Par ailleurs, la presente invention a egalement pour objet une banque d'ADN 
genomique d'une bacterie du genre Streptococcus, de maniere preferee, Streptococcus 
agalactiae, de maniere preferee la CIP 82.45 (ATCC 12403). 

La banque d'ADN genomique decrite dans la presente invention, en particulier 
25 la banque deposee a la CNCM le 28 decembre 2000 sous le numero d'ordre N° 1-2610, 
recouvre en effet Streptococcus agalactiae CIP 82.45 (ATCC 12403). Toutefois, si 
certaines regions n'ont pas pu etre clonees dans ladite banque, en raison de problemes 
de letalites chez Escherichia coli, ces regions peuvent facilement etre amplifiees et 
identifiees par Fhomme du metier, en utilisant des oligonucleotides specifiques des 
30 sequences des extremites des differents clones qui forment les contigs. 

La presente invention concerne egalement les methodes pour Fisolement d'un 
polynucleotide d'interet present chez une souche de Streptococcus agalactiae et absente 
chez une autre souche, qui utilise au moins une banque d'ADN basee par exemple sur 
un plasmide pSYX34 contenant un fragment du genome de Streptococcus agalactiae. 
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La methode selon Pinvention pour Pisolement d'un polynucleotide d'interet peut 
comprendre les etapes suivantes : 

a) isoler au moins un polynucleotide contenu dans un clone de la banque d'ADN 
d'origine de Streptococcus agalactiae, 
5 b) isoler : 

- au moins un polynucleotide genomique ou ADNc d'une bacterie Streptococcus, 
ladite bacterie Streptococcus appartenant a une souche differente de la souche 
utilisee pour la construction de la banque d'ADN de Petape a) ou, de fa?on 
alternative, 

10 - au moins un polynucleotide contenu dans un clone d'une banque d'ADN prepare a 

partir du genome d'une Streptococcus qui est differente de la souche Streptococcus 
agalactiae utilisee pour la construction de la banque d'ADN de Petape a) ; 

c) hybrider le polynucleotide de Petape a) au polynucleotide de Petape b) ; 

d) selectionner les polynucleotides de Petape a) qui n'ont pas forme de complexe 
1 5 d'hybridation avec les polynucleotides de Petape b) ; 

e) caracteriser le polynucleotide selectionne. 

On peut preparer le polynucleotide de Petape a) par la digestion d'au moins un 
clone recombinant avec une enzyme de restriction appropriee, et de fa?on optionnelle, 
P amplification de Pinsert polynucleotide qui en resulte. 
20 Ainsi, la methode de Pinvention permet a Phomme du metier d'effectuer des 

etudes genomiques comparatives entre les differentes souches ou especes du genre 
Streptococcus, par exemple entre les souches pathogeniques et leurs equivalents non 
pathogenes. 

En particulier, il est possible d'etudier et de determiner les regions de 
25 polymorphisme entre lesdites souches. 

L'invention comprend aussi un precede ^identification de sequence specifique 
de Streptococcus agalactiae, caracterise par Talignement de sequences nucleotidiques 
de Streptococcus agalactiae selon l'invention et le traitement de donnees obtenues par 
cet alignement pour isoler les sequences specifiques. 

30 

La presente invention concerne egalement Putilisation des sequences nucleiques 
ou des polypeptides selon la presente invention : 

- pour la secretion de proteines, 

- comme facteurs de virulence, 
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- pour le controle par F intermediate du quorum-sensing, 

- pour F identification de cibles pour les maladies humaines dont Streptococcus 
agalactiae est un modele, et 

- pour F identification de cibles contre les bacteries Gram positives pathogenes 
5 par la methode de genomique soustractive (comme par exemple par comparaison avec 

des bacteries Gram positives non pathogenes). 



EXEMPLES 

Exemple 1 : Materiels et methode 

10 La strategic de sequen9age du genome de Streptococcus agalactiae CIP 82.45 

(ATCC 12403) repose sur un sequen?age alleatoire (shot-gun). La premiere etape de ce 
travail consiste a doner FADN genomique de la bacterie Streptococcus agalactiae dans 
differents vecteurs (plasmides et BAC). 
Materiels et methodes. 

15 1 . Construction des banques : 

a/ Banque de petits fragments dans le vecteur pcDNA2.1 

L'ADN chromosomique de la souche de Streptococcus agalactiae CIP 
82.45 (ATCC 12403) a ete prepare par une methode classique incluant un traitement a 
la proteinase K et une extraction au phenol (9). Environ 10 |ag d'ADN ont ete casses par 

20 nebulisation (1 minute sous une pression de 1 bar) (4). Les extremites des fragments 
d'ADN ont ete rendues franches en faisant agir la DNA-polymerase du bacteriophage 
T4 pendant 15 minutes a 37°C en presence des 4 nucleotides tri-phosphate. L'enzyme a 
ete inactivee par une incubation de 15 mn a 75°C. Des adaptateurs (invitrogen Cat. 
N° 408-18) ont ensuite ete ligatures a ces extremites. Apres ligature, les fragments 

25 d'ADN chromosomiques ayant une taille entre 1 000 et 3 000 paires de bases ont ete 
purifies apres electrophorese sur gel d'agarose. Le vecteur utilise pour la construction de 
la banque, pcDNA2.1 (Invitrogen), a ete digere par l'enzyme BstXl et purifie par 
geneclean (BIO- 101) apres electrophorese sur gel d'agarose. L'ADN chromosomique et 
le vecteur purifie ont ete ligatures par action de la ligase du bacteriophage T4. Le 

30 melange de ligation a ete introduit par transformation dans la souche <X Escherichia coli 
XL2-blue (Stratagene). Environ 4000 colonies sont obtenues par jil du melange de 
ligation. 

b/ Construction d'une banque de fragments de taille moyenne (banque 
deposee a la CNCM sous le numero 1-2610) 
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Afin de limiter la frequence des evenements de co-ligation et de clones 
sans insert, la methode du remplissage partiel du site de coupure a ete utilisee (7). 

L'ADN chromosomique de la souche de Streptococcus agalactiae CIP 
82.45 (ATCC 12403) a ete digere de maniere partielle par l'enzyme de restriction 
5 Sau3A en utilisant une gamme de dilution de l'enzyme. La fraction presentant la gamme 
de tailles souhaitee (entre 2 et 12 kbases) a ete precipitee et les extremites ont ete 
remplies partiellement par le fragment de Klenow de la DNA polymerase &E. coli en 
presence de dTTP et dCTP. Apres purification sur gel d'agarose les fragments d'ADN 
chromosomique ayant une taille comprise entre 3 et 6 kbases ont ete ligues au vecteur 

1 0 pS YX34 (7) digere par l'enzyme Sail remplie partiellement par l'enzyme de Klenow en 
presence de dATP et dGTP. Le melange de ligation a ete introduit par transformation 
dans la souche &' Escherichia coli XLlO-kan (Stratagene) et etalement sur milieu LB 
contenant du chloramphenicol a une concentration de 20 mg/1. Environ 500 colonies 
sont obtenues par |il du melange de ligation. 

15 2. Preparation des plasmides et sequen£age 

Les plasmides ont ete prepares par une methode semi-automatique de 
preparation developpee au laboratoire GMP base sur la methode de lyse alcaline (2). 
Les inserts chromosomiques ont ete sequences a partir de leurs deux extremites en 
utilisant les primer T7 et universel en suivant les recommandations du fournisseur (PE- 

20 biosystems). Les sequences ont ete determinees en utilisant un sequenceur automatique 
de type 3700 (PE-Biosystem). 

3. Assemblage des sequences 

Les sequences ont ete assemblies en utilisant 1'ensemble de logiciel 
developpe a l'Universite de Washington, Phred, Phrap et Consed (5, 8). La finition de la 

25 sequence a ete realisee en utilisant 1'ensemble de logiciel GMPTB (7). L'etape de 
finition correspond au resequen9age des regions ou la sequence est peu sure et le 
sequen9age des regions situees entre les contigs. Elle a ete realisee en sequen?ant des 
produits de PCR correspondant a ces regions identifies par un expert en utilisant les 
logiciels Consed (8) et GMPTB (7). Les sequences des oligonucleotides ont ete defmies 

30 en utilisant les logiciels Consed et Primo (8, 10). 

4. Annotation des sequences 

L'identification des phases codantes (CDS) a ete realisee en utilisant 
1'ensemble de logiciel GMPTB (L. Frangeul et al. non publie). Ce programme combine 
les resultats de differentes methodes : (i) identification de phases ouvertes de lecture et 



WO 02/092818 



44 



PCT/IB02/03059 



leur tri en fonction de leur taille, (ii) 1'analyse de la probability d'etre codante en utilisant 
le logiciel Genemark (11), (iii) Identification d'un debut de traduction (codon 
d'initiation et sequence de fixation du ribosome), (iv) similarite de la sequence proteique 
deduite avec les sequences proteiques contenues dans les banques de sequence en 
5 utilisant le logiciel BLASTP. 

Les fonctions des proteines codees par les phases codantes identifiees 
indiquees au tableau 1 ont ete predites par 1'analyse des resultats de recherche de 
similarites dans les banques en utilisant le logiciel BLASTP (1). 

Exemple 2 : Description scientifique de la banque de BAC de Streptococcus agalactiae 
10 CIP 82.45 (ATCC 12403) deposee a la CNCM le 28 decembre 2000 sous le numero I- 
2610. 

Collection de clones $ Escherichia coli DH 10B™ (Calvin et al., J. Bacteriol. 
170, 2796, 1988) contenant des fragments d'ADN genomique de la bacterie 
Streptococcus agalactiae souche NEM 316,CIP 82.45 (ATCC 12403) , clones dans le 

1 5 vecteur pSYX34 (Xu et al., Biotechniques, 17:57, 1990). Le vecteur a ete digere Sail et 
partiellement rempli a l'aide de l'ADN polymerase afin de produire des extremites 
5'-TC. Des fragments genomiques aleatoires de 3-6 kb provenant de Streptococcus 
agalactiae (souche NEM 316, CIP 82-45, ATCC 12403) ont ete digeres partiellement 
par Sau3A et partiellement remplis afin de produire des extremites 5'-GA. Apres 

20 ligature in vitro et transformation, des clones resistant au chloromphenicol ont ete 
selectionnes. Environ 5000 clones ont ete assembles, suspendus dans 15 ml de milieu L 
et congeles. 

Exemple 3 : Les proteines de surface de Streptococcus agalactiae NEM316 

Les proteines de surface des bacteries pathogenes, et plus particulierement les 

25 proteines dites du type LPXTG (Navarre et Schneewind, Microbial. Mol. Biol. Rev. 63 
174-229), jouent un role crucial lors du processus infectieux en permettant notamment 
des interactions entre le microorganisme et les cellules de Thote et/ou l'echappement au 
systeme immunitaire. Les inventeurs ont don focalise leur etude sur ce type de proteines 
qui presentent la particularite d'etre liees covalemment au peptidoglycane via le motif 

30 d'ancrage carboxylique LPXTG. Cette reaction est catalysee par une enzyme 
bifonctionnelle (endopeptidase-transpeptidase) appelee sortase. L'etude du role de ces 
proteines dans la virulence de S. agalactiae a ete realisee par 2 approches 
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complementaires (construction d'un mutant sortase-deficient, inactivation des genes 

codant pour des proteines de type LPXTG). 

- Le gene srtA de S. agalactiae NEM316 (IPF N°1268). 

Le mutant MEM 1979, depose le 24 avril 2002 a la CNCM sous le numero I- 
5 2861, est une souche mutante derivee de NEM316 (CIP 82.45, ATCC 12403) dans 
laquelle 1TPF 1268 a ete inactive. 

L'analyse du genome de NEM316 nous a permis de caracteriser un gene srtA 
presentant homologie respectivement 55 % et 30 % d'identite avec les sortases de 
Streptococcus gordonii et de Staphylococcus aureus. Ce gene a ete inactive par 
1 0 insertion-inactivation et nous avons montre que le mutant ainsi construit n'adherait plus 
a des cellules epitheliales humaines pulmonaires (A549) et uterines (HeLa). Ces 
resultats suggerent que les proteines du type LPXTG de S. agalactiae jouent un role 
dans la virulence de cette bacterie, en permettant notamment son adhesion avec les 
cellules de l'hote. 

15 - Recensement des proteines du type LPXTG de S. agalactiae NEM3 16. 

Une analyse in silico du genome de NEM316 a revele la presence de 30 
proteines de surface putatives possedant le motif d'ancrage de type LPXTG (Tableau 6). 
Nous avons etudie par amplification PCR, en utilisant des amorces speciflques, la 
distribution des genes codant pour 21 proteines du type LPXTG dans une collection de 

20 99 souches non-redondantes de S. agalactiae responsables d'infections non-invasives 
(70 souches provenant de portage ou d'infection urinaire) et invasives (29 souches 
provenant d'hemoculture ou de meningite). Cette etude a montre que 6 de ces genes 
(IPN N° 1503, 678, 2192, 1861, 584, 280) etaient presents dans toutes les souches de 
notre echantillonnage (Tableau 7). Deux de ces six genes (IPF N°678 et 1503) ont ete 

25 inactives par insertion-inactivation et les mutants correspondants NEM2056 et 
NEM2057 presentaient une adherence diminuee avec les cellules epitheliales A549 
(Tableau 5). 

Le mutant NEM2056, depose le 24 avril 2002 a la CNCM sous le numero I- 

2862, est une souche mutante derivee de NEM316 (CIP 82.45, ATCC 12403) dans 
30 laquelle 1TPF 678 a ete inactive. 

Le mutant NEM2057, depose le 24 avril 2002 a la CNCM sous le numero I- 

2863, est une souche mutante derivee de NEM316 (CIP 82.45, ATCC 12403) dans 
laquelle 1TPF 1503 a ete inactive. 
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- Cibles vaccinates. 

La presence des genes IPF N°1503, 678, 2192, 1861, 584, 280 chez toutes les 
souches de S. agalactiae testees font des proteines correspondantes des cibles vaccinates 
de choix pour le developpement d'un vaccin anti-S. agalactiae. 

TABLEAU 1 : Liste des phases codantes annotees identifies par l'analyse des 
sequences des contigs 
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TABLEAU 2 . Proteines de surface de Streptococcus agalactiae 





SEQID 


N°IPF 


Motif 
LPXTG 


% identite/ similitude 


1 


886 


18 


LPHTG 


24/37 : Sec (Surface exclusion proteine) E. faecalis 


2 


386 


1250 


LPSTG 


22/40 :Secl0 (Surface exclusion proteine) 
Enterococcus faecalis plasmid pCFlO 

J- i_ si 


3 


1669 


280 


LPKTG 


50/65 : pullulanase S. pneumoniae 


4 


1895 


523 


LPATG 


90/91 : alpha like proteine S. agalactiae 


5 


806 


1716 


LPSTG 


31/46 : M-like proteine S. equi 


6 


1183 


2140 


LPLTG 


36/60 : cell-division protein homolog ywcF B. subtilis 
34/56 : stage V sporulation protein E B. halodurans 


7 


1346 


2337 


LPKTG 


25/38 : Unknown B. halodurans 


8 


1942 


571 


LPSTG 


50/60 : Hemagglutinine S. gordonii 


9 


2129 


765 


LPNTG 


28/43 : sdrc S. aureus 


10 , 


2046 


678 


LPKTG 


57/70 : putative cyclo-nucleotide phosphodiesterase 
Strep, dysgalactiae susp. equismilis 


11 ! 


618 i 


1503 


LPKTG 


49/65 : celle envelope proteinase S. thermophilus 


12 


1227 


220 


LPSTG 


30/43 : SspB (adhesion) S. gordonii 


13 i 


1954 : 


584 


LPKTG 


26/48 : hypothetical serine riche repeat prot S. pombe 


14 1 


1493 


2495 


LPKTG 


23/47 : gene drosophile 


15 


1955 


585 


LPKTG 


30/46 : 6-aminohexanoate-cyclic-dimer hydrolase 
Deinococcus radiodurans . 


16 


943 


1861 


LPKTG 


50/62 : hypothetical protein 2 S. mutans 


17 


1221 


2192 


LPKTG 


35/48 : C. elegans UNC-89 (6642 aa) 


18 


613 


15 


LPSTG 


37/52 : SpaA : Ag de surface de S. sobrinus 


19 


382 


1247 


LPSTG 


38/52 : SpaA : Ag de surface de S. sobrinus 


20 


792 


17 


LPKTG 


30 /47 : hypothetical proteine iota de S. pyogenes 
plasmid pDB 101 


21 


383 


1248 


LPRTG 


38/52 : hypothetical proteine iota de S. pyogenes 
plasmid pDBlOl 


22 


1418 


2414 


LPSTG 


33/47 : orfC E. faecalis, plasmid pAM-beta-1 


Autres proteines possibles (IPXTG, FPXTG) 


23 


2171 


807 


IPQTG 


31/43 : Inconnue B. Halodurans 
29/41 : fimbrial SU Actinomyces naeslundii 
24 :41 : putative cell-surface adhesin SdrF 
[Staphylococcus epidermidis] 


24 ' 


1343 


2334 


IPQTG 


27/38 : hypothetical protein 2 L. leichmanii 
23/38 : fimbrial SU Actinomyces naeslundii 


25 


659 


1551 


FPKTG 


37/50 : fibronectin binding protein I S. pyogenes 
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identifies par I'analyse de la sequence genomique complete SEQ ID N°2345 


Fonctions Predites 


similar to glutamyl-aminopeptidase and/or to endo-1 ,4-beta- 
glucanase 


Unknown ~"~ j 


similar to unknown protein 


similar to thioredoxin H1 


weakly similar to phenylalanyl-tRNA synthetase (beta subunit) 


similar to unknown proteins | 


similar to single-strand binding protein ] 


Similar to ABC transporter (ATP-binding protein) | 


similar to unknown proteins 


.Similar to two-component sensor histidine kinase | 


Similar to two-component response regulator 


similar to unknown proteins 


similar to unknown proteins 


Similar to (oligopeptide) ABC transporter (binding protein) 


Similar to oligopeptide ABC transporter (permease) | 


similar to phosphatidylglycerophosphate synthase | 


Similar to ABC transporter (permease) 


Similar to oligopeptide ABC transporter (ATP-binding protein) j 


Similar to oligopeptide ABC transporter (ATP-binding protein) 


Hypothetical protein 


similar to unknown protein 


similar to unknown protein 


[similar to transcription-repair coupling factor 


similar to peptidyl-tRNA hydrolase 


Isimilar to unknown proteins 


similar to hypothetical GTP binding protein 


Hypothetical protein 


similar to unknown protein 


similar to putative transcription regulator 


beta subunit of DNA polymerase III 


Positions / Sens 
(p=plus, m=minus) 


202238-203305 m 


203490-203729 m 


203890-204174 p 


204171-204494 p I 


204527-205153 p 


205207-205923 m 


206004-206399 p 


2190539-2191378 m 


206522-207166 p 


207193-208938 p 


208919-209659 p 


209829-210284 p 


210286-211014 p 


211257-212885 p 


212998-213975 p 


2191378-2191917 m 


213972-214793 p 


214805-215608 p 


I 215592-216218 p 


I 10743-10877 p 


10369-10740 p 


10110-10382 p 


6322-9819 p 


! 5750-6325 p 


| 2192043-2193326 m 


4551-5666 p 


4188-4391 p 


3789-3986 p 


2898-3779 p 


I 1692-2828 p 


TABLEAU 3: Liste des phases codantes annotees i 


i o 

z 

Q> 
C 

:<!> 

ii 


SA-1 000.1 


SA-1001. 1 


SA-1 002.1 


CO 

o 
o 

x — 

< 

CO 


SA-1 004.1 


SA-1 006.1 


SA-1 007.1 


SA-101.1 


SA-1 01 0.1 


SA-1 01 2.1 


SA-1 01 3.1 


SA-1 01 6.1 


SA-1 01 7.1 


SA-1 01 8.1 


SA-1 01 9.1 


SA-1 02.1 


SA-1 020.1 


! SA-1 021.1 


SA-1022.2 


SA-1 024.2 


SA-1 025.2 


SA-1 026.1 


SA-1 028.1 


SA-1029.1 


SA-1 03.1 


SA-1030.1 


SA-1 031.1 


SA-1 032.1 


SA-1 033.1 


SA-1034.1- 


Anciens 
SEQ ID 
(Proteine) 


CN 


CO 




LO 


CO 




OO 


o> 


O 
LO 


T — 

in 


CM 

m 


ID 


in 
m 


CO 
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OO 

in 
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CD 


LO 
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CN 


CO 


SEQ ID 
(Proteine) 


2346 


2347 


2348 


2349 


2350 


2351 


2352 


2353 


2354 


2355 


2356 


2357 


2358 | 


2359 ' 


2360 ; 


| 2361 


2362 


2363 


2364 


2365 


2366 


2367 


2368 


2369 


2370 


2371 


2372 


2373 


2374 


2375 


SEQ ID (ADN) 


SEQ ID n° 4482 


SEQ ID n° 4483 


SEQ ID n° 4484 


SEQ ID n° 4485 


SEQ ID n° 4486 


SEQ ID n° 4487 


SEQ ID n° 4488 


SEQ ID n° 4489 


o 

CO 

o 
CZ 

Q 

O 
LU 

CO 


ISEQ ID n° 4491 I 


SEQ ID n° 4492 


SEQ ID n° 4493 


SEQ ID n° 4494 


SEQ ID n° 4495 


SEQ ID n° 4496 


SEQ ID n° 4497 
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SEQ ID n° 4500 
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CO 
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CD 
LO 
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CO 
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similar to folyl-polyglutamate synthetase 


similar to unknown protein 


similar to homoserine kinase 


similar to homoserine dehydrogenase 


Similar to nickel ABC transporter (binding protein) 


Similar to nickel ABC transporter (permease) j 


Similar to oligopeptide and nickel ABC transporter (permease) 


similar to unknown proteins 


Similar to oligopeptide ABC transporter (ATP-binding protein) | 


Similar to oligopeptide or nickel ABC transporter (ATP-binding 
protein) 


uridylate kinase j 


ribosome recycling factor 


similar to unknown proteins 


similar to peptide methionine sulfoxide reductase 


similar to unknown proteins | 


similar to myosin-crossreactive streptococcal antigen (unknown 
(function) 


similar to phosphate starvation inducible protein, unknown 
function 


Unknown | 


2028876-2030531 m 'similar to two-component sensor histidine kinase | 


2030524-2031201 m {Similar to two-component response regulator (PhoB) j 


Similar to transcriptional regulator PhoU 


similar to phosphate ABC transporter (ATP-binding protein) | 


similar to phosphate ABC transporter (permease) 


similar to phosphate ABC transporter (permease) 


similar to phosphate ABC transporter (binding protein) 


similar to single-strand binding protein 


similar to replication protein (plasmid) 


Unknown [ 


Similar to unknown proteins 


Similar to ribosomal protein L1 1 methyltransferase 


2037692-2038150 m , Similar to unknown proteins 


2038274-2038990 p |Similar to transcriptional regulators 


1233381-1234643 m 


1234645-1235532 m 


1235519-1236385 m 


1236387-1237670 m \ 


1647764-1649380 m 


1646833-1647777 m | 


1646027-1646833 m 


266230-266436 m 


1645251-1646039 m 


1644584-1645264 m 


1643735-1644463 m 


1643162-1643719 m 


1642190-1643044 m 


1641543-1642052 m 


1641331-1641546 m 


1639401-1641173 m 


1638291-1639277 m 


1637397-1638200 p 


2031201-2031857 m 


2031854-2032603 m 


SA-1 395.1 2032596-2033474 m 


2033476-2034321 m 


2034336-2035217 m 


1035400-1035831 m 


266442-267230 m 


2035418-2036005 m 


2036002-2036742 m 


2036742-2037695 m 


SA-1 371.1 


SA-1 372.1 


SA-1 373.2 


SA-1 374.3 


SA-1 377.1 | 


SA-1 378.1 


SA-1 379.1 


SA-1 38.1 


SA-1 380.1 I 


SA-1 381.1 


SA-1 382.1 


SA-1 383.1 


SA-1 384.1 


SA-1 385.1 


SA-1 386.1 ! 


SA-1 388.1 


SA-1 389.1 


SA-1 390.2 


SA-1 391 .2 | 


SA-1 392.1 


SA-1 393.1 


SA-1 394.1 


SA-1 396.1 


SA-1 399.1 


SA-14.1 


SA-1 40.1 


SA-1 400.1 


527 ! SA-1 401.1 


SA-1 403.1 
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Similar to unknown proteins 


Similar to unknown proteins | 


Unknown I 


Unknown I 


Similar to unknown proteins | 


similar to xylulose-5-phosphate/fructose-6-phosphate 
phosphoketoiase 


Similar to unknown proteins I 


Weakly similar to transcriptional regulator (antiterminator) 


similar to unknown proteins 


1913595-1915112 m similar to L-xylulose kinase | 


Unknown ! 


Similar to galactitol-specific PTS enzyme IIC 


similar to glycerate dehydrogenase | 


Unknown 


similar to undecaprenol kinase j 


similar to competence negative regulator mecA 


weakly similar to DNA translocase | 


similar to Streptococcus mutans RgpG protein required for 
biosynthesis of rhamnose-glucose polysaccharide 


157319-158089 p similar to ABC transporter (ATP-binding protein) j 


similar to unknown protein j 


similar to aminotransferase, putative cysteine desulfurase 


similar to NifU protein 


similar to unknown protein | 


similar to serine-type D-Ala-D-Ala carboxypeptidase (penicilin 
binding protein) 


similar to serine-type D-Ala-D-Ala carboxypeptidase (penicilin 
binding protein) 


50S ribosomal protein L31 | 


similar to metal ABC transporter (binding protein) 


Unknown 


similar to dipeptidase 


6091 1 5-61 0026 p Similar to unknown proteins 


Similar to unknown proteins | 


Similar to unknown proteins 


2039029-2039499 m 


2039471-2039929 m 


2039916-2040059 m 


26741 "1-267725 m 


2040065-2040535 m 


-1907193-1909571 m 


1909661-1910752 m 


1911069-1912748 m 


1912814-1913575 m 


1915178-1916167 m j 


1916189-1917640 m 


SA-1424.1 ; 1917738-1918694 m 


1918713-1919732 m 


154278-155117 p 


155237-155992 p 


267824-269182 m 


155994-157154 p 


158126-159388 p 


159390-160622 p 


160609-161052 p 


161152-162570 p 


162642-163829 m 


163982-165217 m 


613213-613473 m 


611580-613100 p 


269145-269570 m 


610041-611438 p 


608144-609118 p 
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SA-1436.1 | 
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SA-1440.1 


SA-1441.1 
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Similar to unknown proteins 


Similar to purine nucleoside hydrolase 


Similar to unknown proteins | 


asparaginyl-tRNA synthetase 


similar to unknown proteins 


similar to aspartate aminotransferase 


similar to ATP-dependent DNA helicase 


Similar to meso-2,3-butanediol dehydrogenase (D-acetoin 
forming) 


similar to gamma-glutamylcysteine synthetase (for the 
NJerminal part) and to cyanophycinsynthetase (C-terminal part) 


Similar to unknown proteins 


Unknown | 


Similar to transcriptional regulators and to PTS enzyme II | 


I Similar to adenylosuccinate synthase 


[Unknown 


Similar to unknown protein 


Putative PTS enzyme IIC 


similar to mannitol-specific PTS enzyme IIB 


similar to mannitol-specific PTS enzyme IIA 


Similar to hexulose-6-phosphate synthase | 


similar to putative acetyl transferase 


Similar to hexulose-6-phosphate isomerase § 


Similar to L-ribulose-5-phosphate 4-epimerase 


similar to hypothetical transaldolase 


: Unknown 


(Unknown 


Similar to unknown proteins 


Similar to unknown proteins I 


Similar to the putative sigma factor ComX1 


similar to putative acetyl transferase 


Similar to phosphoglycerate mutase 


Similar to D,D-carboxypeptidase 


(Similar to N-acetyl muramidase 


606690-607103 m 


605461-606444 m 


604907-605464 m 


SA-1449.1 ; 603521-604867 p 


269636-269917 m | 


602307-603500 p 


599714-602221 p — 


598842-599606 p 


1931763-1934015 p 


1930919-1931593 p 


270084-270542 p 


1929535-1930557 m 


1927872-1929164 m I 


1927556-1927849 p i 


1926600-1927247 m 


1924993-1926432 m 


! 1924687-1924965 m 


1924135-1924620 m 


1923357-1924022 m 


270919-271479 p 


1922490-1923353 m 


1921772-1922488 m 


1921114-1921761 m 


104233-104421 p 


104755-105075 p 


105865-106416 p 


106636-107055 p 


SA-1479.1 i 107255-107734 p 


i 271579-272157 p 


107856-108548 p 


108545-109297 p 


109294-109869 p 
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SA-1 463.1 | 
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SA-1471. 1 
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Similar to transcription repressor of class 1 heat-shock (HrcA) 


Similar to heat shock protein GrpE 


Chaperone protein DnaK | 


Chaperone protein DnaJ 


similar to unknown protein 


ribosomal protein L11 


similar to transmembrane efflux pump protein j 


similar to hypothetical N-acyl-L-amino acid amidohydrolase 


similar to transcriptional regulator (LysR family) 


similar to unknown proteins 


similar to para-aminobenzoate synthase, component I 


Similar to DNA translocase 


similar to peptidyi-prolyl cis-trans isomerase 


similar to surface antigen proteins, putative peptidoglycan bound 
protein (LPXTG motif) 


similar to unknown proteins 


similar to metal ABC transporter (permease) 


similar to metal ABC transporter (ATP-binding protein) 


similar to metal ABC transporter (binding protein) 


similar to C5A peptidase, putative peptidoglycan linked protein 
(LPXTG motif) 


similar to two-component response regulator 


similar to two-component sensor histidine kinase 


2087111-2087719 p lUnknown 


similar to RNA polymerase ECF sigma factor 


leucyl-tRNA synthetase 


similar to unknown proteins 


similar to competence protein ComFC 


competence protein ComFA 


similar to unknown proteins 


similar to cysteine synthetase A 


similar to glycerol dehydrogenase 


similar to hypothetical transaldolase 


similar to transcriptional regulator (TetR/AcrR family) I 


similar to formate acetyltransferase 


110012-111046 p 


111049-111621 p 


111802-113631 p 


113920-1 15059 p 


272173-272880 p 


1650563-1650988 m | 


1651199-1652581 m 


1652589-1653803 m 


1654062-1654967 p | 


1655028-1655381 p 


1655410-1657125 m 


1657207-1659648 m 


1659823-1660626 p 


745991-748792 p 


273140-274087 m 


1660678-1661511 m 


1661513-1662229 m 


1662400-1663326 m 


2080002-2084714 p 


2084947-2085633 p 


2085630-2087018 p 


274084-274575 m 


2087806-2090307 m 


356072-356626 p 


355330-355995 p 


354041-355330 p 


353341-353985 m 


352324-353250 m 


351084-352172 p 


350348-351016 p 


275157-275765 m 


347882-350338 p 
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SA-1512.2 


SA-1 51 3.1 
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Similar to glucose-inhibited division protein GidB 


Similar to unknown proteins 


Similar to other proteins 


Similar to unknown proteins 


Similar to two-component response regulator 


1 735822-1 737327 m ' Similar to two-component sensor histidine kinase j 


Similar to two-component response regulator I 


similar to other proteins 


similar to unknown proteins 


similar to unknown proteins | 


similar to diacylglycerol kinase 


similar to GTP binding proteins | 


Unknown I 


Unknown | 


Similar to two-component sensor histidine kinase 


Unknown 


similar to transcriptional regulator 


similar to formamidopyrimidine-DNA glycosylase 


similar to dephosphocoenzyme A kinase | 


similar to ABC transporter (ATP-binding protein) | 


Unknown 


similar to mevalonate kinase 


similar to efflux pump j 


Similar to glucan 1 ,6-alpha-glucosidase 


Similar to UDP-galactose 4-epimerase j 


similar to two-component response regulator 


similar to two-component sensor histidine kinase 


similar to organic acid transport protein 


similar to malic enzyme ((S)-malate:NAD+ oxidoreductase) | 


similar to mevalonate diphosphate decarboxylase 


Similar to transctiptional regulator CtsR 


Similar to endopeptidase CIp ATP-binding chain C | 


Similar to acyltransferase 


similar to deoxypurine kinase subunit | 


Similar to transcription regulator | 


Similar to other proteins 


1740472-1741185 p | 


1739790-1740344 m 


1738879-1739769 m 


1738241-1738774 m 


1737317-1738006 m I 


1452688-1453374 m 


1636729-1637205 m 


1635601-1636407 m 


1634709-1635206 m 


1634330-1634728 m 


1633389-1634288 m 


1632751-1633152 m 


1631767-1632021 m 


1451459-1452688 m 1 


1629232-1630824 p , 


1628167-1629015 m 


1627197-1628018 m 


1626613-1627200 m 


1625788-1626489 m 


1624152-1625798 m 


1450465-1451343 m 


1622787-1623995 m 


1988716-1990323 m 


1987633-1988628 m 


1986932-1987612 p 


1985404-1986930 p 


1983913-1985250 m 


1982725-1983888 m 


1449539-1450483 m 


1942117-1942581 m 


1939673-1942120 m 


1938962-1939453 p 


1938307-1938948 p 


1937209-1938186 p 


1936350-1937225 p 
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Similar to other proteins 


Similar to unknown proteins | 


similar to phosphomevalonate kinase 


cell wall separation I 


similar to aminotransferase 


similar to unknown protein 


Similar to unknown proteins 


Similar to UDP-N-acetylmuramate-alanine ligase 


similar to unknown protein, putative peptidoglycan bound protein 
(LPXTG motif) 


similar to Isopentenyl diphosphate isomerase | 


Similar to unknown proteins 


Similar to SWl/SNF family helicase 


Similar to GTP binding protein | 


Similar to primosome component (helicase loader) Dnal 


Similar to unknown proteins 


Similar to unknown protein 


Unknown 


similar to unknown protein 


similar to other protein 


similar to penicillin-binding protein 2a 


similar to other protein 


putative peptidoglycan linked protein (LPXTG motif) 


similar to ABC transporter (ATP-binding protein) 


Similar to unknown protein, putative ABC transporter 
(permease) 


similar to unknown proteins 


Similar to unknown protein 


Similar to unknown protein 


Unknown 


Similar to 2,3-dihydroxybenzoate-AMP ligase (C-terminal 
Sdomain) 


Similar to 2,3-dihydroxybenzoate-AMP ligase (enterobactin 
| synthetase component E) 


Similar to transcription regulator | 


1934954-1936210 p 


1934139-1934957 p 


1448554-1449546 m 


28975-30318 p 


31518-32693 p 


32683-33444 p 


1725796-1726299 m 
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1038856-1039578 m [ 
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Similar to late competence protein required for DNA binding and 
uptake comEB 


Similar to similar to Xaa-Pro dipeptidase 


similar to unknown proteins 


Similar to unknown protein 


1817240-1818739 m similar to multidrug resistance protein 


nucleoside-diphosphate kinase 


hypothetical 


similar to unknown proteins 


similar to unknown proteins 


similar to unknown proteins 


similar to other proteins 


similar to unknown proteins j 


Similar to putative acetyl transferase 


Similar to unknown proteins 


2043157-2043462 m Unknown 


Unknown 


Similar to unknown proteins 


Unknown 


weakly similar to integrase I 


similar to unknown proteins \ 


hypothetical gene 


Similar to transcriptional regulator (phage related) 


Similar to unknown proteins 


Similar to unknown proteins 


Similar to chromosome segregation SMC protein 


Similar to ribonuclease III 


Similar to unknown proteins 


Similar to unknown proteins ! 


Similar to two-component sensor histidine kinase 


similar to 3-hydroxy-3-methylglutaryl-coenzyme A reductase 


similar to two-component response regulator 


Similar to unknown proteins 


Similar to chorismate synthase 


Similar to 3-dehydroquinate synthase 


similar to 3-dehydroquinate dehydratase 


1814891-1815343 m 


1815355-1816422 m | 


1445361-1446275 p 


1816522-1817238 m 


959863-960279 p j 


959293-959553 p 


SA-1737.1 ; 957581-958246 p 


957253-957594 p 


956387-957256 p 


1444618-1445274 p 


952252-956385 p 


2040862-2041353 p 


2041346-2042614 p i 


2043446-2043847 m 


2043835-2045043 m 


2045045-2045437 m 


2045504-2045959 m 


1444176-1444625 p 


2046386-2046622 m 


2046794-2047288 p 


774016-774840 p 


773219-774016 p I 


769589-773128 p \ 


768895-769581 p 


768351-768719 p 


767539-768348 p 


766186-767535 p 


1442801-1444084 p 


765483-766193 p | 


1503364-1503699 m 


1503783-1504949 m 


1504950-1506017 m 


1506111-1506788 m 


SA-1 728.1 


SA-1 729.1 


SA-1 73.1 


SA-1 730.1 


SA-1 731. 2 


SA-1 732.2 


SA-1734.1 ! 
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1506788-1507945 m I Similar to unknown proteins 


1508080-1510224 p .Similar to unknown proteins | 


50S ribosomal protein L20 | 


Similar to'ferredoxin j 


similar to 3-hydroxy-3-methylglutaryl-coenzyme A synthase 
(HMG-CoA synthase) 


Similar to unknown protein j 


Similar to tripeptidase 


Similar to unknown protein 


Similar to UDP-N-acetylmuramoylalanyl-D-glutamyl-2, 6- 
diaminopimelate ligase 


similar to ferrichrome ABC transporter (ATP-binding protein) | 


similar to ferrichrome ABC transporter (binding protein) j 


1520270-1521295 p 'similar to ferrichrome ABC transporter (permease) 


Similar to ferrichrome ABC transporter (permease) 


Similar to unknown protein | 


thymidylate synthase j 


Similar to two-component sensor histidine kinase | 


Similar to ABC transporter (permease) | 


Similar to ABC transporter (ATP-binding protein) 


similar to unknown proteins | 


similar to autoinducer-2 production protein (LuxS) | 


similar to unknown proteins | 


similar to unknown proteins j 


1440060-1440554 m 'similar to dihydrofolate reductase 


similar to unknown proteins 


similar to poly(A) polymerase | 


Similar to ABC transporter (ATP-binding protein) | 


similar to unknown proteins 


Similar to ABC transporter (ATP-binding protein) I 


Similar to ABC transporter (ATP-binding protein) j 


similar to unknown proteins J 


Similar to 4-alpha-glucanotransferase (amylomaltase) 


Similar to glycogen phosphorylase 


similar to plasmid surface exclusion protein, putative 
peptidoglycan bound protein (LPXTG motif) 


1510465-1510824 m \ 


1513077-1513274 p 


1441627-1442799 p 


1513261-1513752 m j 
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1516895-1518349 p 


1518504-1519298 p 


1519322-1520254 p ! 
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1440634-1441473 m 
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similar to unknown protein 


Unknon, similar to unknown protein 


similar to unknown protein (transmembrane) 


similar to ABC transporter (ATP-binding protein) 


similar to transcription regulator (N-terminal part) 


similar to unknown protein 


similar to unknown protein J 


similar to unknown protein 


similar to unknown transmembrane protein 


similar to unknown protein 


CAMP factor 


similar to unknown proteins | 


Unknown 


similar to unknown proteins 


Unknown 


similar to unknown proteins 


Similar to fructose-specific PTS enzyme IIABC | 


similar to Fructose-1 -phosphate kinase 


similar to transcription repressor of fructose operon FruR 


Unknown j 


similar to to Cell Wall Muropeptide Branching Enzyme | 


similar to cell wall proteins, putative peptidoglycan linked protein 
(LPXTG motif) j 


similar to 2-dehydropantoate 2-reductase 


Similar to transcriptional regulator (Lad family) 


similar to esterase | 


Similar to unknown proteins 


Similar to unknown proteins | 


manganese-dependent superoxide dismutase j 


Similar to transcription antiterminator 


Similar to beta-glucoside-specific PTS enzyme IIABC | 


similar to oligopeptide ABC transporter (ATP-binding protein) f 


similar to oligopeptide ABC transporter (ATP-binding protein) 


similar to oligopeptide ABC transporter (permease) I 


similar to oligopeptide ABC transporter (permease) | 


similar to oligopeptide ABC transporter (binding protein) | 


2061393-2061728 m 


2062250-2062738 m 


2062907-2063668 m ! 


2063665-2064567 m ] 


2064772-2065848 m 


2066097-2066711 m 


2066925-2067221 p 


2067238-2067798 p 


2068103-2068966 p 


2069123-2069425 m 


2069598-2070365 m 


1470405-1471253 m 


1436804-1437127 m j 


1471253-1471633 m 


1471705-1472232 m 


1472289-1472783 m 


1472972-1474936 m 


1474933-1475844 m 


1475841-1476650 m 


1435996-1436646 m 


1476715-1477950 m ! 


S 1478094-1479725 m | 


1479940-1480863 m 


833223-834167 p 


834226-835218 m 


835394-836122 p 


836176-837213 p 


837293-837901 p 


838239-839090 p 


839083-840951 p 


170247-171179 p 


169201-170247 p 


168157-169188 p 


167233-168147 p 


165459-167114 p 
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Unknown 


chaperonin GroEL 


similar to multidrug resistance protein 


Ribosomal protein L10 


Similar to unknown proteins 


excinuclease ABC (subunit C) I 


Transmembrane N-terminal domain, C-terminal domain similar 
to hydrolases 


similar to NADH dehydrogenase 


similar to dipeptidase 


similar to unknown proteins j 


similar to unknown proteins 


1429976-1430341 m ribosomal protein L7/L12 I 


Hpr (ser) kinase/phosphatase I 


Similar to unknown proteins 


Similar to unknown proteins 


Similar to unknown proteins 


Similar to oxidoreductase 


Similar to unknown proteins 


Similar to unknown proteins 


Similar to unknown proteins 


Similar to signal recognition particle and to cell division protein 
FtsY 


similar to glycine betaine/carnitine/choline ABC transporter (ATP- 
binding protein) 


similar to choline ABC transporter (permease) 


similar to glycine betaine/carnitine/choline ABC transporter 
(osmoprotectant-binding protein) 


similar to glycine betaine/carnitine/choline ABC transporter 
(permease) 


similar to efflux protein (truncated) 


similar to transcriptional regulator (Rgg like) 


Unknown 


Unknown 


Unknown 


pseudogene 


2108908-2109204 p 


2109304-2110926 m 


1348211-1349551 m 


1430405-1430905 m 


1347385-1348152 p 


1345445-1347226 m 


1343622-1345403 p 


1342850-1343452 m | 


1341397-1342803 m 


1340716-1341300 m 


1339967-1340701 m ! 


782771-783706 p , 


782280-782543 p 


781741-782199 p 


SA-1944.1 | 779616-781778 p 


778468-779511 p 


778207-778335 m | 


777299-778201 m 


776487-777299 m 


774840-776450 p 


256648-257793 m 


256013-256648 m 


255084-256010 m 


254433-255083 m 


253190-254176 p 


252257-253117 p 


251133-251414 p 


1429562-1429735 m 


250713-251099 p 


250324-250728 p 


SA-1 924.1 


SA-1 926.2 


SA-1 929.2 | 


SA-1 93.2 


SA-1 930.1 


SA-1 931.1 


SA-1 932.2 


SA-1 933.2 j 


SA-1 934.2 


SA-1 935.1 


1007 : SA-1 937.1 


1009 SA-1 94.1 | 


SA-1 940.3 i 


SA-1 942.1 I 


SA-1 943.1 I 


SA-1 945.1 


SA-1 946.1 
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SA-1 952.2 


SA-1 953.2 


SA-1 954.1 
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Unknown 


Unknown 


similar to ATP-dependent helicase 


similar to unknown proteins 


1392147-1392512 m Isimilarto unknown proteins 


1390283-1392160 m similar to conjugative transposon relaxase 


similar to plasmid protein (replication protein ?) f 


similar to lactose repressor 


similar to unknown proteins 


Similar to unknown proteins 


similar to transcriptional regulator 


Unknown 


Similar to UDP-D-glucose:galactosyl glucosyltransferase 


862527-863243 p similar to unknown proteins 


similar to methyl transferase (from transposon) 


Alanyl-tRNA synthetase 


similar to unknown proteins 


Similar to unknown proteins 


Similar to DNA mismatch repair protein MutS 


Similar to unknown proteins 


Similar to thioredoxin 


Similar to transcriptional regulators 


3.2 DNA restriction/modification and repair 


Similar to A/G-specific adenine glycosylase 


Similar to unknown protein 


Similar to unknown proteins | 


Similar to unknown proteins 


Similar to other proteins 


Similar to transcriptional regulator 


Similar to Cyclopropane fatty acid synthase 


Similar to unknown proteins | 


1025155-1025412 m lUnknown 


1041931-1043013 m .similar to unknown proteins 


similar to unknown proteins 


Similar to unknown proteins 


excinuclease ABC (subunit A) 


249517-250104 p 


249110-249517 p 


1393216-1395234 m 


1392522-1392881 m 


1428750-1429565 m I 


1389373-1390128 m | 


866024-866614 m j 


865181-865939 p 


864963-865178 p 


864595-864918 p 


863331-864149 p | 


1428091-1428513 m 


859827-862445 p 


859326-859811 p 


1831275-1831817 m 


1828851-1831190 m 


1828347-1828847 m 


1827952-1828266 m 


1827313-1827906 p 


1427312-1428664 m I 


1826012-1827136 p 


1866085-1866867 m 


1864869-1866041 p 


1864198-1864734 m 


1863567-1864154 m 


1862715-1863440 m 


1861455-1862645 p 
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ISEQ ID n° 5317 ; 3181 
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Similar to unknown proteins 


Similar to transport protein 


30S ribosomal protein S18 


Similar to single strand binding protein | 


30S ribosomal protein S6 


cell division protein FtsH 


similar to hypoxanthine guanine phosphoribosyltransferase 


similar to other protein 


weakly similar to beta-lactamase 


similar to unknown proteins 


Similar to transcriptional regulator (Lad family) 


similar to maltose ABC transporter (binding protein) 


Similar to maltose/maltodextrin ABC transport system 
(permease) 


similar to maltodextrin ABC transporter (permease) 


similar to di-tripeptide ABC transporter (permease) 


Similar to putative mutator MutT protein 


Unknown 


Unknown 


similar to plasmid replication protein 


2149459-2150064 p isimilar to unknown proteins I 


2148362-2149462 p similar to other proteins 


2148042-2148362 p iUnknown 


Unknown 


similar to unknown proteins 


similar to cadmium-efflux system accessory protein 


putative transport protein 


hypothetical transport protein 


similar to threonine synthase 


similar to alcohol dehydrogenase | 


Unknown 


similar to alcohol-acetaldehyde dehydrogenase | 


similar to unknown proteins 


Similar to S-adenosylmethionine tRNA ribosyltransferase 


Similar to transcriptional regulator, MarR family 


Similar to unknown proteins 


1822035-1822706 m 


1822731-1823675 m 


1823845-1824084 m | 


1824129-1824620 m | 


1824632-1824919 m 


14009-15985 p 


13444-13986 p 


12165-13439 p 


10877-12163 p 


1426503-1426889 m 


1569925-1570953 m 


1571209-1572456 p 


1572554-1573924 p 


1573924-1574760 p 


1574991-1576463 p 


1576508-1576972 m 


1426273-1426506 m 


1577056-1577244 m 


2150270-2150875 p 


2147391-2147840 p 


2145655-2147070 p 


2145266-2145604 p 


2144640-2145254 p 


75018-76298 p 


73423-74913 p 


72286-73302 p 


1425689-1426270 m 


69465-72107 p 


849073-849753 p 


847892-848920 m 


847368-847805 m 


846249-847313 p 


SA-2005.1 


SA-2006.1 


SA-2007.1 | 


CM 
CO 
O 
O 
CM 

it 


1073 ; SA-2009.2 | 


SA-2015.2 


CM 

o 

CM 
1 

< 

CO 


SA-2018.2 


SA-2019.3 


SA-202.1 


SA-2022.2 


SA-2024.1 


! SA-2025.1 


SA-2026.1 


SA-2028.1 


SA-2029.1 


SA-203.1 


SA-2030.2 


SA-2033.2 


1093 ; SA-2034.1 


1094 SA-2035.4 


SA-2037.4 


SA-2038.1 


SA-2040.1 


SA-2041.2 


SA-2042.2 


SA-2045.2 


SA-2047.1 


SA-2048.1 


SA-205.1 


SA-2050.2 


SA-2051.2 


1106 | SA-2052.1 


SA-2053.1 


SA-2054.1 


CO 
CD 
O 


o 
t-~ 
o 


T— 

o 


CM 

o 


1078 ! 


CO 

o 


o 

OO 

o 


CO 

o 


CM 
OO 
O 


CO 
OO 
O 


1084 


LO 
00 

o 


CO 
CO 

o 


CO 

o 


OO 
00 

o 


o> 

00 

o 


o 

CO 

o 


CNI 

CD 
O 


LO 
CO 

o 


CO 
CO 

o 


CO 

o 


CO 
CO 

o 


CO 
CO 

o 


o 
o 


o 




CO 

o 


3 


to 
o 


o 


OO 

o 


3214 


3215 i 


3216 


3217 


3218 


3219 


3220 


3221 


3222 


3223 


3224 I 


3225 j 


3226 


3227 


3228 


3229 


3230 


3231 


3232 


SEQ ID n° 5369 j 3233 


SEQ ID n° 5370 | 3234 


3235 


3236 | 


3237 


3238 


3239 


3240 


3241 


3242 


3243 


3244 


3245 


3246 


3247 


3248 


SEQ ID n° 5350 


|SEQ ID n° 5351 1 


SEQ ID n° 5352 ! 


SEQ ID n° 5353 


LO 
CO 
LO 
o 
CZ 

Q 

O 
LU 

CO 


SEQ ID n° 5355 


SEQ ID n° 5356 


SEQ ID n° 5357 


|SEQ ID n° 5358 


SEQ ID n° 5359 


SEQ ID n° 5360 


CD 
CO 
LO 
o 
C 

Q 

O 
LU 

CO 


SEQ ID n° 5362 


SEQ ID n° 5363 i 


|SEQ ID n° 5364 


SEQ ID n° 5365 


SEQ ID n° 5366 


SEQ ID n° 5367 j 


SEQ ID n° 5368 1 


SEQ ID n° 5371 


SEQ ID n° 5372 


ISEQ ID n° 5373 


SEQ ID n° 5374 


LO 

co 

LO 
o 
C 

Q 

O 
LU 

CO 


SEQ ID n° 5376 


h~ 

CO 
LO 

o 

Q 
O 

UJ 

CO 


SEQ ID n° 5378 


SEQ ID n° 5379 


SEQ ID n° 5380 


ISEQ ID n° 5381 | 


SEQ ID n° 5382 


SEQ ID n° 5383 


SEQ ID n° 5384 



WO 02/092818 



375 



PCT/IB02/03059 



Similar to permease (gluconate ?) 


Similar to putative glycerate kinase 


similar to unknown proteins 


Similar to unknown proteins 


Similar to beta-glucosidase \ 


ribosomal protein S17 I 


ribosomal protein L29 


ribosomal protein L16 


ribosomal protein S3 


ribosomal protein L22 


ribosomal protein S1 9 | 


similar to plasmid transfer complex protein TrsK I 


ribosomal protein L2 


ribosomal protein L23 | 


ribosomal protein L4 


ribosomal protein L3 


ribosomal protein S10 


similar to transposase (truncated) 


similar to transposase, N-terminal part 


Unknown 


Unknown 


streptococcal C5a peptidase 


Similar to sucrose-6-phosphate hydrolase 


Similar to transcriptional regulator (Lad family) 


Similar to transcription termination protein NusB 


Similar to unknown proteins | 


Similar to translation elongation factor EF-P 


similar to ABC transporter (ATP-binding protein) 


similar to ABC transporter (binding protein) 


glucose-6-phosphate isomerase 


similar to unknown protein 


466785-467456 p similar to unknown protein 


similar to putative ABC transporter (binding protein) 


Unknown | 


similar to unknown protein from conjugative transposon 


similar to UDP-glucose pyrophosphorylase 


844892-846148 p 


843725-844867 p 


1425120-1425608 m | 


842464-843558 m 


840968-842395 p 


81399-81659 p 


81 167-81373 p i 


80744-81157 p 


80087-80740 p 


79730-80074 p 


79436-79714 p 


1423303-1425120 m 


78504-79337 p 


78190-78486 p 


SA-2073.1 1 77567-78190 p 


76917-77543 p 


76504-76812 p 


1351826-1352680 p 


1363404-1363694 p 


1362139-1363350 m 


1423041-1423283 m I 


1358151-1361603 m 


1800964-1802403 p ; 


1802405-1803367 p 


1803454-1803888 m 


1803881-1804270 m 


1804359-1804919 m 


1806098-1807819 m 


1807809-1809566 m 


464590-465939 p 


466261-466788 p 


467588-468631 p 


1043024-1043371 m 


1422170-1423024 m 


468722-469621 m 
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similar to glycerol-3-phosphate dehydrogenase 


similar to ribonuclease P protein component [ 


similar to unknown protein and to B. subtilis SpolllJ protein | 


Unknown 


Unknown 


similar to hypothetical transcriptional regulator 


Unknown 


Unknown 


similar to unknown protein from conjugative transposons 


Unknown 


Similar to unknown proteins 


Unknown 


Unknown 


Unknown 


Unknown 


Unknown 


Similar to manganese-dependent inorganic pyrophosphatase 


similar to plamsid transfer complex protein TraE 


Similar to pyruvate-formate lyase activating enzyme 


Similar to unknown protein 


Similar to unknown proteins 


Similar to unknown protein 


Similar to unknown protein | 


similar to unknown protein 


similar to transposase 


degenerate transposase 


degenerate trnasposase 


Degenerate transposase 


Similar to histidine triad protein 


laminin-binding surface protein 


similar to two-component response regulator VncR | 


similar to two-component sensor histidine kinase VncS 


Similar to transposase C-terminal end (truncated) 


Similar to unknown proteins 


similar to plasmid and conjugative transposon protein 


similar to FtsW and RodA proteins 


469658-470674 m 1 


470844-471173 p 


471186-472001 p 


2047351-2048703 m 


2048713-2049804 m 


2050044-2050988 m 


2051052-2051441 m 


2052439-2052756 p 


1421755-1422108 m 


2052805-2052933 p 


2053374-2053664 p 


2053763-2054137 p 


2054427-2055155 p | 


2055450-2055644 p | 
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similar to unknown protein 


DNA gyrase, subunit B I 


similar to two-component response regulator | 


ribosomal protein L34 


Similar to unknown proteins | 


similar to betaine ABC transporter permease and substrate 
binding protein 


similar to glycine betaine ABC transporter (ATP-binding protein) 


similar to transcription antitermination factor nusG j 


similar to glycosyl transferase | 


similar to glycosyl transferase 


similar to unknown protein 


similar to unknown proteins | 


similar to transporter 


1244116-1245459 p jsimilar to staphylokinase and streptokinase j 


similar to unknown protein 


similar to unknown protein 


similar to succinic semialdehyde dehydrogenase | 


similar to glycine betaine transporter (N-terminal end) j 


similar to glycine betaine transporter (C-terminal end) 


similar to unknown protein C-terminal part I 


similar to unknown protein (N-terminal part) | 


similar to unknown proteins | 


1 100661-1 102145 m similar to carbon starvation protein A | 


similar to two-component response regulator lytR 


similar to two-component sensor histidine kinase LytS 


Unknown 


Unknown | 


Unknown j 


Similar to ATP-dependent RNA helicase, DEAD-box family 


putative ABC transporter (binding protein) 


similar to ABC transporter (permease) 


823164-823898 p similar to ABC transporter (ATP-binding protein) j 


Similar to unknown proteins 


Similar to peptide-chain-release factor 3 


630703-631263 p 


631264-633216 p 


1900897-1901571 m 


1901927-1902061 m ! 


1902245-1903600 m 


1903847-1905574 m 


1905593-1906816 m 


2095537-2096076 m | 


2094285-2095490 p 


2093024-2094220 p 


2091974-2092819 m 


1415704-1416552 p 


2090684-2091931 p j 


1243011-1243697 m j 


1241896-1242903 m 
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821033-822577 p 
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Similar to surface proteins, putative peptidoglycan linked protein 
(LPXTG motif) 


similar to cardiolipin synthetase j 


similar to formate-tetrahydrofolate ligase 


similar to lipoate-protein ligase f 


similar to unknown protein 


similar to ATP-dependent CIp protease ATP-binding subunit 
ClpA 


Putative peptidoglycan linked protein (LPXTG motif) 


similar to trigger factor (prolyl isomerase) 


similar to unknown protein | 


similar to unknown protein 


similar to unknown protein 


similar to phosphomethylpyrimidine kinase 


similar to tRNA pseudouridine synthase A 


Similar to other proteins 


similar to unknown proteins | 


similar to transcriptional regulator 


similar to DNA repair and recombination protein RecN 


similar to unknown proteins 


similar to unknown proteins 


Similar to unknown proteins 


similar to unknown proteins 


similar to unknown protein 


similar to unknown protein 


Unknown | 


similar to unknown protein 


similar to unknown protein 


similar to transcriptional regulator, GntR family 


similar to unknown protein 


similar to other protein 


similar to thiol peroxidase 


similar to unknown proteins 


Similar to PTS enzyme IIA 


Similar to PTS enzyme IIB I 


Similar to galactitol-specific PTS enzyme IIC 


819318-820856 p 


1140455-1 142050 m 


1142169-1 143839m' 


1143928-1144947 m 


1144974-1145852 m 


1043463-1045295 m 


1410000-1414904 m 


120068-121351 p 


119069-119911 m 


118463-119032 p 


118002-118466 p 


117234-117992 p 


116495-117271 p | 


115177-116424 p | 


573586-574413 p 


574400-574873 p 


574885-576543 p I 


576656-577492 p ; 


577467-578324 p 


578299-578901 p 


1250993-1251574 m 


1250789-1250983 m 


1250191-1250733 m 


1409808-1409999 m 


1249935-1250132 m 


1249362-1249913 m 


1248557-1249198 m 


1247788-1248552 m 


1247129-1247788 m 


1246562-1247056 m 


1245953-1246486 p 


2001195-2001659 m 


2000888-2001193 m 


1999400-2000848 m 


SA-2192.2 


SA-2195.3 I 


SA-2196.2 


SA-2197.2 


SA-2198.2 j 


SA-22.1 


SA-220.1 


SA-2200.2 


SA-2201. 1 


SA-2202. 1 


SA-2203. 1 


SA-2204. 1 


SA-2205. 1 


SA-2206.2 


SA-2207.2 


SA-2208.2 


SA-2210.1 


SA-2212.1 ! 


SA-2213.1 


SA-2214.2 


SA-2216.2 


SA-2217.1 


SA-2219.1 


SA-222.1 


SA-2220.1 


SA-2221.1 


SA-2222.1 


SA-2223.1 


SA-2224.1 


SA-2225.1 


SA-2226.2 


SA-2227.2 


SA-2228.1 


SA-2231.1 
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3358 


3359 


3360 


3361 


3362 


3363 


3364 


3365 


3366 


3367 ! 


3369 j 


3370 


3371 


3372 


3373 | 


3374 


3375 


3376 


3377 


3378 


3379 


3380 


3381 


3382 


3383 


3384 


3386 


3387 


3388 


SEQ ID n° 5491 


SEQ ID n° 5492 


SEQ ID n° 5493 


SEQ ID n° 5494 


SEQ ID n° 5495 


SEQ ID n° 5496 


SEQ ID n° 5497 i 


SEQ ID n° 5498 I 


SEQ ID n° 5499 


SEQ ID n° 5500 


ISEQ ID n° 5501 


ISEQ ID n° 5502 


SEQ ID n° 5503 


SEQ ID n° 5504 


SEQ ID n° 5505 
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SEQ ID n° 5507 


SEQ ID n° 5508 
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SEQ ID n° 5510 
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SEQ ID n° 5521 


SEQ ID n° 5522 


SEQ ID n° 5523 


SEQ ID n° 5524 
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2112289-2113185 m I Similar to ABC transporter (permease) 


2113201-2114163 m putative ABC transporter (binding protein) | 


similar to unknown proteins 


similar to unknown proteins j 


similar to unknown proteins | 


Unknown | 


Unknown 


similar to signal recognition particle chain Ffh 


similar to unknown protein 


1068545-1069858 m isimilar to two-component sensor histidine kinase | 


Similar to unknown proteins | 


Similar to other proteins 


Similar to competence protein ComEA 


similar to competence protein CelB (ComEC) | 


Similar to unknown proteins | 


Similar to rhamnosyl transferase I | 


Similar to putative hexosyltransferase 


Similar to transcription regulator j 


similar to plasmid DNA topoisomerase 


similar to putative helicase and methylase 


Similar to fibronectin binding protein, peptidoglycan bound 
protein (LPXTG motif) 


similar to ferrichrome ABC transporter (permease) 


similar to (iron?) ABC transporter (permease) j 


similar to sugar O-acetyltransferase | 


similar to ribonuclease HII 


similar to unknown protein, hypothetical GTP binding protein 


similar to unknown proteins 


similar to multidrug resistance protein 


similar to hypothetical transcription factor | 


Unknown 


group B oligopeptidase PepB 


similar to hypothetical phosphoglycolate phosphatase | 


similar to methyltransferase 


similar to protease maturation protein 


2114628-2115425 m 


2115611-2116471 p 


2116514-2117245 p 


1065700-1066194 m I 


1066231-1066419 m 


1066541-1068106 m 


1068124-1068456 m 


827664-828428 m j 


828563-829303 p 


829403-830056 p 


830049-832277 p | 


832403-833212 p 


1540196-1541044 m 


1539067-1540206 m 


1537486-1539015 p 


1045297-1047045 m 


1402425-1408625 m ! 


1534497-1537202 m j 


1095272-1096246 m 


SA-2303.1 1096243-1097205 m 


1097444-1097992 m 


1098013-1098774 m 


1098761-1099612 m 


1099888-1100460 m 


852521-853672 p 


853724-854671 p 


1402054-1402353 m 


854687-856492 p 


SA-2312.1 i 856687-857313 p 


857387-858094 p 


858155-859084 p 


SA-2276.1 


SA-2278.1 I 


SA-2279.1 


SA-2280.1 


SA-2281.2 i 


SA-2282.2 


SA-2283.1 


SA-2285.1 


1301 i SA-2287.1 


SA-2288.2 


SA-2289.2 


SA-2291.1 


SA-2292.1 | 


SA-2294.2 | 


SA-2295.2 


SA-2296.2 


SA-2297.1 


SA-2298.1 


SA-23.1 


1313 , SA-230.1 


SA-2300.3 


SA-2302.2 


SA-2304.1 


SA-2305.1 


SA-2306.1 


SA-2307.2 


SA-2308.2 


SA-2309.1 


SA-231.1 


SA-2311.1 


SA-2313.1 


SA-2314.2 
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3422 


3423 


3424 ! 


3425 j 


3426 I 


3427 


SEQ ID n° 5564 : 3428 j 


3429 


3430 


3431 


3432 


3433 


3434 


3435 I 


3436 ; 


3437 


3438 


3439 


3440 


3441 


3442 


3443 


3444 


SEQ ID n° 5583 , 3447 


ISEQ ID n° 5584 ! 3448 


3449 


3450 


3451 


3452 


3453 


3454 


3455 


SEQ ID n° 5558 


SEQ ID n° 5559 j 


SEQ ID n° 5560 


SEQ ID n° 5561 


ISEQ ID n° 5562 


SEQ ID n° 5563 ! 


SEQ ID n° 5565 


SEQ ID n° 5566 


SEQ ID n° 5567 


SEQ ID n° 5568 


ISEQ ID n° 5569 


SEQ ID n° 5570 


SEQ ID n° 5571 


SEQ ID n° 5572 


SEQ ID n° 5573 
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SEQ ID n° 5576 


ISEQ ID n° 5577 


SEQ ID n° 5578 


SEQ ID n° 5579 


|SEQ ID n° 5580 


ISEQ ID n° 5581 


ISEQ ID n° 5582 


ISEQ ID n° 5585 


ISEQ ID n° 5586 


ISEQ ID n° 5587 


SEQ ID n° 5588 


ISEQ ID n° 5589 


SEQ ID n° 5590 


SEQ ID n° 5591 
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similar to anaerobic (class III) ribonucleotide reductase large 
subunit chain 


Unknown 


similar to oxidoreductase 


similar to unknown proteins 


similar to anaerobic ribonucleotide reductase activator 


Unknown 


Similar to glutathione reductase 1 


Similar to unknown protein (secreted protein) | 


Similar to iron-sulfur cofactor synthesis protein (NifS like) j 


Similar to hypothetical thiamine biosynthesis protein Thil 


similar to capsular polyglutamate biosynthesis | 


Unknown | 


similar to fructose-bisphosphate aldolase class-ll | 


similar to L-2-hydroxyisocaproate dehydrogenase 


SOS ribosomal protein L28 


putative peptidoglycan linked protein (LPXTG motif) | 


Similar to sortase protein | 


Similar to sortase protein \ 


Putative peptidoglycan linked protein (LPXTG motif) | 


capsular polysaccharide chain length regulator/exporter 1 


similar to unknown proteins 


similar to glucose-1 -phosphate transferase 


beta-1 ,4-galactosyltransferase enhancer | 


beta-1 ,4-galactosyltransferase j 


capsular polysaccharide repeating-unit polymerase | 


similar to glycosyl transferase 


similar to glycosyl transferase 


capsular polysaccharide biosynthesis protein 


similar to DNA repair protein RadC 


similar to unknown protein j 


Unknown 


similar to unknown protein 


similar to iron-sulfur cofactor synthesis protein or cysteine 
desulfurase 


similar to putative rhamnosyltransferase 


2119955-2122153 m 


2119737-2119880 m 


2118792-2119724 m 


2118292-2118783 m ! 


2117602-2118219 m j 


1401744-1402043 m 


1501840-1503189 m 


1501345-1501797 p 


1499953-1501098 m 


1498737-1499951 m 


1497457-1498635 m 


1400941-1401579 m 


143337-144218 p ! 


144303-145220 m 


145459-145647 p 


SA-2334.1 I 1532350-1534374 m 


1531360-1532238 m 


1530476-1531360 m 


1529553-1530479 m 


1289559-1290257 m 


1399815-1400900 m 


1288158-1289546 m ! 


1287685-1288134 m 


1287212-1287685 m 


1286070-1287215 m 


1285105-1286073 m 


1284124-1285071 m 
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dTDP-L-rhamnose synthase 


similar to unknown protein [ 


RNA polymerase major sigma factor RpoD | 


DNA primase | 


similar to DNA-directed RNA polymerase (delta subunit) j 
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similar to unknown protein 


similar to ABC transporter (ATP-binding protein) 


similar to other protein, putative transmembrane protein 


similar to thioredoxin reductase 


similar to tRNA (guanine-NI)-methyltransferase 


similar to 16S rRNA processing protein RimM 


similar to unknown proteins | 
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ribosomal protein S2 


putative chain length regulator CpsC | 


Unknown | 


similar to penicillin-binding protein 1A 


Unknown j 


similar to other proteins (C-terminal end) j 
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similar to plasmid replication protein 
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similar to ferrichrome ABC transporter (ATP-binding protein) ] 
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similar to thioredoxin reductase ) 
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Unknown, similar to amino acid ABC transporter (binding 
protein) 


similar to phosphate ABC transporter (binding protein) j 
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similar to Similar to beta-glucoside specific PTS system enzyme 
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Hypothetical gene | 


ribosomal protein L14 | 


similar to unknown proteins | 


similar to transketolase 
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similar to transcriptional regulatory protein (N-terminal part) 
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glycyl-tRNA synthetase (alpha subunit) 


Unknown 


similar to unknown proteins 
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similar to transcriptional regulator (phage related) j 
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similar to unknown proteins 


similar to unknown proteins 


Similar to unknown proteins 


similar to N-terminal first 100 amino acids of anaerobic 
ribonucleotide reductase 


similar to probable D-amino acid oxidase 


Unknown 


similar to plasmid transfer complex protein 


Unknown 


similar to plasmid proteins j 


similar to surface antigen proteins, putative peptidoglycan bound 
protein (LPXTG motif) 


Unknown J 


Unknown | 


glucose-1 -phosphate thymidyltransferase 


437152-437463 p ! Unknown 


similar to replication initiation protein from Staphylococci plasmid 


Unknown 


similar to plasmid partition protein ParA 


Unknown 
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433584-434921 p 'similar to plasmid proteins j 


similar to unknown protein 


Unknown 


Unknown 


similar to unknown proteins 


Unknown 


similar to single-strand binding protein 


similar to plasmid transfer complex protein 


similar to membrane nuclease 


Putative peptidoglycan bound protein (LPXTG motif) 


similar to plasmid surface exclusion protein, putative 
peptidoglycan bound protein (LPXTG motif) 


similar to unknown proteins 


Unknown 


1350730-1351386 p | 


1350071-1350568 m 


1322151-1322939 m 


1136745-1137083 m 


1321039-1322142 m | 


433313-433570 p 


431344-433293 p 


427052-427534 p I 


423803-426952 p I 


419921-422722 p 


718598-719092 p 


718373-718561 p 


1320126-1320980 m 


436764-437147 p 


SA-2987.2 ! 436473-436751 p 


435658-436476 p 


434935-435519 p 


1319519-1320112 m 


430687-431334 p 


430382-430687 p 


SA-2993.1 i 429918-430151 p 


427654-429861 p 


423553-423810 p 


422894-423325 p 


1025432-1027381 m 


728737-729537 p 


419147-419869 p 


416809-419070 p 


415712-416794 p 


415354-415701 p 


SA-2954.1 


SA-2955.1 


SA-296.1 i 


SA-2961.1 


SA-297.1 | 


SA-2973.2 


SA-2974.2 


SA-2975.2 


SA-2976.2 


SA-2977.2 


SA-2978.1 


SA-2979.1 


SA-298.5 


SA-2985.2 


SA-2986.2 


SA-2988.2 


SA-2989.1 


SA-299.5 


SA-2990.1 


SA-2991.1 


SA-2992.1 


SA-2995.1 


SA-2997.1 


SA-2998.1 


SA-3.1 I 


SA-30.1 


SA-3000.1 


SA-3001.1 


SA-3002.1 


SA-3003.1 
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3801 | 
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3808 


3809 | 
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3812 | 
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3814 
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SEQ ID n° 5944 


|SEQ ID n° 5945 


|SEQ ID n° 5946 j 
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SEQ ID n° 5949 


SEQ ID n° 5950 | 


ISEQ ID n° 5951 


SEQ ID n 6 5952 


SEQ ID n° 5953 ! 


SEQ ID n° 5954 


SEQ ID n° 5955 


SEQ ID n° 5956 


SEQ ID n° 5957 


|SEQ ID n° 5958 


SEQ ID n° 5959 


|SEQ ID n° 5960 


SEQ ID n° 5961 


SEQ ID n° 5962 


ISEQ ID n° 5963 


SEQ ID n° 5964 


ISEQ ID n° 5965 


SEQ ID n° 5966 
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similar to ATP-dependent CIp protease ATP-binding subunit 
ClpA 


similar to plasmid DNA topoisomerase 


similar to plasmid proteins | 


Unknown | 


similar to dTDP-glucose-4,6-dehydratase | 


similar to unknown proteins j 


Unknown j 


similar to unknown proteins 


Unknown 


402013-402330 p Unknown | 


Unknown j 


Unknown 


similar to unknown protein | 


Unknown 


Unknown 


Unknown | 


Unknown 


Unknown 


similar to unknown proteins 


Unknown 


Unknown 


similar to plasmid replication protein j 


Unknown | 


Unknown | 


Unknown | 


Unknown 


j hyaluronate lyase 


similar to other proteins 


similar to unknown proteins 


similar to unknown protein 


truncated, C-terminal part 


similar to unknwon proteins (N-terminal part) | 


1312564-1313754 m Isimilarto unknwon proteins ( 


Isimilarto unknown proteins 


Unknown 


413430-415262 p 


411680-413428 p 


733632-737567 p , 


406491-406748 p 


1318266-1319312 m 


403999-406365 p 


403487-403945 p 


402670-403470 p 


402323-402670 p 


401344-401619 p | 


400373-401221 p 


399313-400317 p 


398278-399234 m 


398037-398285 p 


397879-398022 p 


397291-397701 p 


396849-397298 p 


396213-396659 p 


395785-396213 p 


395570-395773 p 


393821-395314 p 


393581-393808 p 


393469-393588 p 


393284-393463 p 


393036-393365 p 


1314996-1318214 p | 


1314297-1314779 m 


! 1313846-1314307 m 


917842-918033 p \ 


733433-733630 p 


732834-733436 p 


1311348-1312574 m 


I 1056055-1056402 m 
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SA-3011.1 
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SA-3035. 1 
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SA-305. 1 


SA-306. 1 


SA-307.1 


SA-3071. 1 


SA-3072. 1 | 


! SA-3073. 1 


SA-308. 1 


SA-309. 1 


SA-31.1 
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3836 | 


SEQ ID n° 5973 3837 | 


SEQ ID n° 5974 ', 3838 
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3842 ] 
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1 3855 
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SEQ ID n° 5998 3862 
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similar to alpha-acetolactate synthase 


similar to alpha-acetolactate decarboxylase j 


ribosomal protein S14 | 


ribosomal protein L36 j 


similar to hypothetical fibronectin-binding protein 


similar to unknown prorteins 


Similar to ABC transporter (permease) 


Similar to ABC transporter (ATP-binding protein) j 


similar to unknown proteins 


CD 
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Unknown | 


similar to unknown proteins | 


similar to ribose 5-phosphate isomerase [ 


similar to phosphopentomutase 


similar to arsenate reductase (hypothetical) \ 


similar to purine nucleoside phosphorylase 


putative transport protein 


similar to purine-nucleoside phosphorylase 


similar to unknown proteins 


similar to transcriptional regulator (LysR family) 


similar to unknown proteins 


similar to phosphoribosylaminoimidazole carboxylase II 


similar to phosphoribosylaminoimidazole carboxylase 


similar to phosphoribosylamine-glycine ligase 


similar to unknown proteins 


similar to acetyl xylan esterase (hypothetical) 


^similar to glucose kinase and to XylR transcriptional regulator 


similar to N-acetylneuraminate lyase 


similar to unknown proteins 


Unknown I 


similar to unknown proteins 


Similar to ABC transporter (permease) 


Similar to sugar ABC transporter (permease) 


Similar to ABC transporter (binding protein) 


similar to unknown proteins 


1309556-1311238 m j 


1308823-1309542 m 


83021-83206 p 


88552-88668 p 


1307114-1308769 p 


1305752-1306756 m 


1304876-1305739 m i 


1304115-1304876 m i 


1302157-1303818 m 


1301312-1302100 m | 


1056395-1056712 m 


1300512-1301222 m 


1299603-1300274 m i 


1298335-1299546 m 


1297877-1298284 m 


1297029-1297838 m 


1295771-1297027 m 


1295077-1295787 m 


1294301-1295068 m 


1293353-1294276 p 


60992-61249 p 


59909-60982 p 


59431-59922 p 


57888-59150 p 


56801-57604 m 


55801-56778 p 


54912-55793 p 


53978-54895 p 


53319-53981 p 


1057106-1057381 m 


52856-53299 p 


52013-52843 p 


51116-52003 p 


49712-51028 p 
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SA-312.1 1 


SA-3 125.1 j 
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group B streptococcal surface immunogenic protein | 


46370-47269 p isimilar to Streptococcus equi zoocin A endopeptidase 


similar to bifunctional 

phosphoribosylaminoimidazolecarboxamide 
formyltransferase/l M P cyclohyd rolase 


similar to unknown proteins | 


similar to Phosphoribosylglycinamide formyltransferase 


similar to phosphoribosylformylglycinamide cyclo-ligase 


similar to phosphoribosylpyrophosphate amidotransferase | 


Unknown 


similar to Phosphoribosylformylglycinamidine synthase 


similar to phosphoribosylaminoimidazolesuccinocarboxamide 
synthase 


similar to ATP-dependent protease CIpE | 


Similar to unknown proteins 


similar to unknown proteins 


similar to unknown protein 


isoleucyl-tRNA synthetase 


similar to cell division protein DivlVA 


similar to unknown proteins | 


Similar to unknown proteins | 


Similar to unknown proteins 


Similar to unknown proteins | 


cell division protein FtsZ 


Similar to cell division protein FtsA | 


Similar to cell division protein DivlB 


Similar to undecaprenyl-PP-MurNAc-pentapeptide-UDPGIcNAc 
GlcNAc transferase 


Similar to UDP-N-acetylmuramoylalanine-D-glutamate ligase 


Similar to unknown proteins 


similar to putative GTP-binding elongation factor 


similar to unknown proteins | 


similar to glucose kinase 


similar to unknown proteins 


47416-48720 p 


44630-46177 p 


43858-44610 p 


43287-43835 p 


42097-43119 p 


40615-42069 p 


1057504-1058352 m 


36656-40381 p 


35829-36533 p 


562906-565167 m 


562265-562720 m ! 


561899-562201 m 


1058408-1059412 m 


558990-561782 p 


557935-558705 p 


557137-557925 p 


556881-557135 p 


556273-556878 p 


555590-556261 p 


554301-555581 p 


552906-554279 p 


551497-552633 p 


550417-551493 p 


549059-550414 p 


548684-548929 p 


546798-548639 p 


546186-546566 p 


545206-546174 p 


545000-545209 p 
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SA-351.1 j 
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similar to unknown proteins 


Unknown 


similar to endonuclease III 


similar to other proteins 


Similar to Acetyl-COA acetyltransferase (truncated) 


Unknown j 
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similar to other proteins 


similar to Anthranilate synthase component II (Glutamine amido- 
transferase) 


similar to ABC transporter (exporter) (ATP-binding protein) 


similar to ABC transporter (exporter) (ATP-binding protein) | 


Similar to unknown proteins 


similar to unknown protein | 


Unknown | 


similar to unknown proteins 


similar to unknown proteins | 


Similar to unknown proteins 


similar to unknown proteins | 


similar to phosphopantetheine adenyltransferase | 


Unknown j 


similar to unknown proteins j 


Unknown 


Similar to unknown proteins 


Similar to asparagine synthetase 


similar to metal-dependent transcriptional regulator j 


Similar to 5 -methylthioadenosine nucleosidase/S- 
adenosylhomocysteine nucleosidase 


Similar to unknown proteins j 


Similar to ADP-ribose pyrophosphatase 


similar to UDP-N-acetylglucosamine pyrophosphorylase 


Similar to unknown proteins j 


Similar to unknown proteins | 


similar to oxidoreductase 


Unknown 


similar to unknown proteins C-terminal end 


544450-544845 m 


1059491-1060447 p 


543817-544449 p 


542475-543704 p 


541439-542482 p I 


540863-541378 p 


539746-540738 m 


539206-539745 m 


538572-539138 p 


536705-538444 p j 


534970-536715 p 


534259-534774 p 


1027391-1028038 m I 


1060440-1060688 m 


533153-534259 p 


532524-533102 p ! 


531121-532455 p 


529973-531046 p 


529498-529983 p 


529211-529501 p 


528447-529199 p 


1060703-1060846 m 


528080-528529 m ! 


527043-528035 p 
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1664180-1664869 m 
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1667772-1668149 m 
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1669191-1669445 m 
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Unknown 


similar to oxidoreductases 
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similar to ATP-dependent DNA helicase ] 


similar to unknown proteins 
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similar to probable amino-acid transporter 


similar to putative cation efflux system protein j 


similar to unknown proteins | 


similar to unknown proteins 


similar to unknown proteins 
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similar to repressor protein - phage associated 
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similar to aspartokinase [ 


similar to unknown protein | 
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Similar to streptococcal hemagglutinin from Streptococcus 
gordonii, Putative peptidoglycan bound protein (LPXTG motif) 


Similar to transcription regulator RofA related 


excinuclease ABC chain B 


Similar to unknown proteins j 


glutamine ABC transporter permease and substrate binding 
protein 


glutamine ABC transporter ATP-binding protein 


Unknown | 


Similar to unknown proteins j 


Similar to GTP-binding protein | 


Similar to aminopeptidase 


Putative peptidoglycan bound serine rich protein (LPXTG motif) 


similar to amidase or hydrolase, putative peptidoglycan bound 
protein (LPXTG motif) 


Similar to fructokinase 


Similar to mannose-6-phosphate isomerase 


Similar to preprotein translocase SecA subunit f 


similar to 2-dehydro-3-deoxyphosphoheptonate aldolase | 


similar to holo-acyl-carrier protein synthase | 


similar to alanine racemase 


1789964-1791502 m Similar to immunogenic secreted protein | 


Similar to ATP-dependent DNA helicase RecG 


Similar to oxidoreductase 


Unknown | 


hypothetical gene 


Similar to shikimate 5-dehydrogenase 


Similar to L-asparaginase 


Similar to unknown proteins 


Similar to unknown proteins | 


Similar to putative aminotransferase 


Similar to transcriptional regulator (CodY family) | 


Similar to other proteins | 


Similar to 3-hydroxyacyl-CoA dehydrogenase 


Similar to unknown proteins 


1595010-1598942 m 


1599325-1600821 p I 


1600918-1602909 m | 


1602970-1603890 m | 


1604073-1606256 p 


1606256-1606996 p 


1607145-1607495 p I 


1607587-1607745 m I 


1607771-1609084 m 


1609451-1610692 p 


1610726-1611304 m 


1611414-1613456 m 


1797911-1798792 m 


1796846-1797793 m 


SA-591.1 i 1794209-1796737 m 


1793076-1794083 m 


1792692-1793051 m 


1791595-1792695 m 


1787869-1789884 m 


1786664-1787578 m 


1028574-1028807 m \ 


2156179-2156709 m 


1785688-1786566 m 


1784691-1785653 p 


1783240-1784622 m 


1782732-1783184 p 


1781253-1782464 m 


1780342-1781127 m 


1779727-1780275 m 


1778715-1779680 p 


1777897-1778526 m 


SA-571. 1 


SA-572. 1 


SA-573. 1 


SA-574. 1 


SA-575. 1 


SA-576. 1 


SA-577. 1 


SA-578. 1 


SA-579. 1 


SA-582. 1 I 


SA-584.1 


SA-585.4 


SA-589.2 


SA-590.1 


SA-592.2 I 


SA-593.2 


SA-594.2 


SA-597.1 


SA-598.1 


SA-599.1 


SA-6.1 


SA-60.1 


SA-600.1 


SA-601.1 


SA-602.1 


SA-603.2 


SA-604.2 


SA-605.1 


SA-606.1 


SA-607.1 


SA-608.1 
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Similar to unknown proteins 


Similar to Pyruvate Phosphate Dikinase j 


Similar to Glu-tRNA Gin amidotransferase subunit C | 


Similar to Glutamyl-tRNA Gin amidotransferase subunit A [ 


Similar to Glu-tRNA amidotransferase subunit B 


Similar to unknown proteins 


Similar to unknown proteins 


Similar to unknown proteins | 


Similar to unknown proteins 


similar to integrase, C-terminal part 


Similar to probable nicotinate-nucleotide adenylyltransferase 


1766488-1767075 m I Similar to unknown proteins | 


similar to unknown proteins j 


Similar to unknown proteins 1 


Similar to transporter (antiporter) 


Similar to UDP-N-acetylmuramoylalanyl-D-glutamyl-2,6- 
;diaminopimelate-D-alanyl-D-alanyl ligase 


Similar to D-alanine-D-alanine ligase 


Similar to recombination protein RecR 


Similar to penicillin binding protein 2B 


Similar to phosphoglycerate mutase | 


Unknown j 


Similar to triosephosphate isomerase 


elongation factor Tu j 


Similar to cell division protein FtsW and to RodA protein | 


Similar to phosphoenolpyruvate carboxylase | 


Similar to oligopeptidase 


Similar to unknown proteins 


Similar to unknown proteins 


Similar to two-component response regulator 


Similar to bacteriophage endolysin 


Similar to other proteins 


Similar to transcriptional regulator 


Similar to putative phosphoglycerate mutase | 


Similar to unknown proteins 


lysyl-tRNA synthetase 


1777056-1777886 m I 


1774398-1777043 m 


1773958-1774260 m 


1772492-1773958 m | 


1771050-1772492 m 


1770006-1770920 m I 


1769362-1769922 m | 


1768244-1769362 m 


1767834-1768151 m | 


2156559-2157413 p 


1767072-1767704 m 


SA-622.2 1 1765903-1766424 m 


818453-819139 p 


817104-818324 p 


815550-816917 p 


814357-815403 p 


813620-814216 p 


811563-813605 p 


810739-811431 p 


2157770-2158441 p 


809804-810562 p 


808427-809623 p 


806807-808075 p 


803906-806701 p 


801898-803697 m 


801450-801839 p 


800942-801466 p 


2158526-2159197 p 
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Similar to GTP pyrophosphokinase (stringent response protein 
RelA) 


Similar to unknown proteins 


Similar to adhesion proteins 


similar to pneumococcal histidine triad protein B precursor (N- 
terminal part) 


similar to pneumococcal histidine triad protein B precursor (C- 
terminal part) 


Similar to transcriptional regulator, DeoR family 


similar to two-component response regulator 


similar to ornithine carbamoyltransferase 


theronyl-tRNA synthetase 


similar to glucosyl transferase 


similar to hexosyltransferase | 


similar to alpha-amylase ! 


catabolite control protein A 


similar to X-Pro dipeptidase 


similar to beta-N-acetylglucosaminidase 


Unknown 


similar to oxidoreductase 


Similar to hypothetical two-component sensor histidine kinase 


similar to D-mannonate hydrolase 


similar to glucuronate isomerase 


similar to 2-dehydro-3-deoxyphosphogluconate aldolase 


similar to transcriptional regulator (GntR family) | 


similar to beta-glucuronidase 


similar to 2-keto-3-deoxygluconate kinase 


similar to transporter 


similar to D-lactate dehydrogenase 


Similar to hypothetical two-component response regulator 


similar to PTS enzyme IIBC 


similar to transcriptional regulator, LysR family 


Unknown 


putative transmembrane protein 


similar to ABC transporter (ATP-binding protein) ' 


2007175-2009391 m 


2006722-2007165 m 


2005544-2006467 m 


2004072-2005517 m 


2002936-2004174 m I 


2001878-2002654 p 


712522-713226 p 


2163240-2164238 m 


710357-712300 p I 


708566-709900 p 


707566-708564 p 


706055-707521 p 


704919-705923 p 


703624-704709 m 


701776-703566 p 


700948-701760 p 


699956-700795 p 


2164341-2165636 p 


698786-699832 p 


697368-698768 p 


696734-697351 p 


695946-696617 p 


694118-695917 p 


693076-694101 p 


691459-693009 p 


690261-691253 p 


2165633-2166466 p 


689189-690247 p 


6881 12-688996 m 


687257-688075 p 


686320-687093 p 


685667-686323 p 


SA-680.1 


SA-681.1 


SA-682.1 ' 


SA-686.1 


SA-687.1 


SA-688.2 


SA-689.2 


SA-69.1 


SA-690.1 


SA-691.1 


SA-692.1 


SA-693.1 i 


SA-694.2 


SA-696.2 


SA-697.1 


2063 i SA-698.1 


SA-699.1 


SA-70.1 


SA-700.1 


SA-701.1 


SA-702.1 


SA-704.1 


SA-705.1 


SA-706.1 


SA-707.1 


SA-708.2 


SA-71.1 


SA-710.2 


SA-712.1 


SA-713.1 


SA-714.1 


SA-715.1 


2048 


2049 


2050 


2051 


2052 


2053 


2054 


2055 


2056 ! 


2057 


2058 


2059 


2060 


2061 


2062 


2064 


, 2066 


2067 


2068 


2069 


2070 


2071 


2072 


2073 


2074 


2075 


2076 


o 
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CM 
CM 


2078 


2079 


2080 


4197 


4198 


4199 | 


4200 


4201 


4202 | 


4203 I 


4204 


4205 


4206 


4207 


4208 


4209 


4210 


4211 


4212 


4213 


4214 


4215 


SEQ ID n° 6352 4216 


4217 


4218 


4219 


4220 


4221 


4222 


4223 


4224 


4226 


4227 


4228 
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SEQ ID n° 6334 j 
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SEQ ID n° 6337 
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|SEQ ID n° 6341 
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SEQ ID n° 6343 


SEQ ID n° 6344 


SEQ ID n° 6345 


SEQ ID n° 6346 
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similar to unknown proteins 


similar to competence associated membrane nuclease 


similar to plasmid proteins 


Similar to osmoprotectant ABC transporter (ATP-binding protein) 


Unknown 


similar to plasmid partition protein ParA 


Unknown | 


similar to replication initiation protein from Staphylococci plasmid 


Unknown 


Unknown | 


similar to unknown protein 


similar to unknown protein | 


1016320-1017915 p similar to oligopeptide and pheromone binding protein 


similar to integrase/recombinase 


SA-732.1 1013816-1014754 p |similar to two-component sensor histidine kinase 


similar to two-component response regulator 


1 .2 Transport/binding proteins and lipoproteins j 


similar to ABC transporter (ATP-binding protein) 


similar to Lactococcus lactis nisin-resistance protein C-terminal 
part 


similar to Lactococcus lactis nisin-resistance protein N-terminal 
part 


similar to unknown protein 


similar to other lipoprotein | 


similar to osmoprotectant ABC transporter permease and 
substrate binding protein 


similar to unknown protein 


similar to glucose-inhibited division protein 


similar to transcriptional regulator (GntR family) 


similar to GMP synthetase 


similar to unknown proteins 


440132-440767 p ! similar to unknown protein 


similar to unknown proteins 


684812-685450 m | 


683949-684734 p 


1023804-1025141 m 


2166688-2167410 p 


1023206-1023790 m 


1022249-1023067 m | 


1021974-1022252 m 


1021578-1021961 m | 


1021262-1021573 m 


1019800-1021128 m 


1018711-1019397 m 


1017948-1018721 m i 


1014797-1015867 m 


1013151-1013819 p 


1011086-1013041 p 


1010332-1011084 p 


1009866-1010306 p 


1009345-1009884 p 


1008691-1009179 m 


1007811-1008659 p 


2167413-2168927 p 


1006935-1007678 p 


1005523-1006857 p 


1004711-1005409 p 


1002936-1004498 m 


439342-440142 p 


441254-441733 p 


SA-716.1 


SA-717.2 


SA-719.2 


SA-72.1 


SA-720.1 


SA-721.2 


SA-722.2 


SA-723.2 


SA-725.2 


SA-726.2 


SA-727.1 


SA-728.1 


SA-729.1 


SA-731.2 


SA-733.1 


SA-734.1 


SA-735.1 


SA-736.1 


SA-737.1 


SA-738.1 


SA-739.1 


SA-74.1 


SA-740.1 


SA-741.1 


SA-742.1 


SA-743.2 


SA-744.3 


SA-745.1 


SA-746.1 


2081 


2082 | 


2083 I 


2084 


2085 


2086 


2087 I 


2088 


2089 


2090 


2091 


2092 


2093 ! 


2096 


SEQ ID n° 6379 i 4243 2097 


2098 ; 


2099 


2100 


2101 


2102 


2103 


2104 


2105 


2106 


2107 


2108 


2109 


2110 


2111 


2112 


4229 | 


4230 


4231 


4232 


4233 


4234 


4235 


4236 


4237 I 


4238 | 


4239 


4240 


4241 


4242 


SEQ ID n° 6380 4244 


4245 


4246 


4247 


4248 


4249 


4250 


4251 


4252 


4253 
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4255 
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4258 
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SEQ ID n° 6367 
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ISEQ ID n° 6375 
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SEQ ID n° 6378 


ISEQ ID n° 6381 


|SEQ ID n° 6382 
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SEQ ID n° 6385 
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SEQ ID n° 6389 


SEQ ID n° 6390 


SEQ ID n° 6391 


SEQ ID n° 6392 


ISEQ ID n° 6393 


SEQ ID n° 6394 
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similar to transcription termination-antitermination factor nusA 


similar to unknown protein 


similar to putative ribosomal protein 


membrane protein similar to other proteins 


initiation factor 2 J 


ribosome binding factor A j 


similar to esterase 


similar to negative transcriptional regulator (copper transport 
operon) 


similar to copper-transporting ATPase (CopA) S 


similar to copper chaperone (copper transport operon) 


similar to unknown protein 


similar to unknown protein | 


similar to other proteins j 


DNA polymerase I 


similar to unknown protein | 


simiular to transcription regulator (Fur family) 


similar to fibrinogen binding protein, putative peptidoglycan 
linked protein (LPXTG motif) 


similar to two-component response regulator 


similar to two-component sensor histidine kinase 


similar to unknown protein 


similar to tRNA-guanine transglycosylase | 


similar to unknown proteins | 


similar to unknown protein (putative zinc finfer motif) | 


similar to biotin synthase 


similar to unknown protein 


similar to unknown protein | 


similar to unknown proteins 


isimilar to negative regulator of FtsZ ring formation protein EzrA 


similar to phosphoserine phosphatase | 


similar to unknown proteins | 


similar to unknown proteins 


enolase 


441769-442920 p 


442942-443238 p 


443231-443533 p 


2169006-2171546 m ! 


443553-446336 p 


446427-446795 p 


446879-447883 m 


448047-448463 p 


448476-450710 p 


450751-450957 p 


451067-451681 p 


451696-452508 p 


2171530-2172279 m ; 


452621-455263 p 


455293-455733 p 


455815-456294 p 


456447-458012 p 


458125-458811 p j 


458813-459850 p 


459864-460604 m 


460791-461933 p 


2172407-2172763 m 


462043-462351 p 


462358-462897 p 


463036-463812 p 


463812-464318 p 


2172831-2175149 m 


633310-635034 p 


635128-635769 p 


635790-636275 m 


636288-636743 m 


636941-638248 p 


SA-747.1 


SA-748.1 


SA-749.1 


SA-75.1 | 


SA-751.1 


SA-752.1 | 


SA-753.1 


SA-754.1 


SA-756.1 I 


SA-757.1 | 


SA-758.1 


SA-759.1 


SA-76.1 


SA-760.1 


SA-761.1 ; 


SA-762.1 


SA-765.1 


SA-766.1 


SA-767.1 


SA-768.2 


SA-769.2 


SA-77.1 


SA-770.1 


SA-772.1 


SA-773.1 


SA-774.2 


SA-78.2 


i SA-782.2 


SA-783.1 


SA-784.1 


SA-785.1 


SA-786.1 


2113 


2114 


2115 
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2119 


2120 


2121 I 
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2124 I 


2125 ; 
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2138 


2143 


2145 


2146 


2147 


4289 1 2148 


2149 


4259 


SEQ ID n° 6396 I 4260 


4261 


4262 


4263 


4264 1 


SEQ ID n° 6401 4265 j 


4266 I 


4267 I 


4269 I 


4270 


4271 


4272 I 


4273 , 
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4280 
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SEQ ID n° 6397 


SEQ ID n° 6398 


SEQ ID n° 6399 
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SEQ ID n° 6409 
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similar to unknown proteins ] 


similar to 5-enolpyruvylshikimate-3-phosphate synthase j 


similar to shikimate kinase 


Similar to membrane bound transcriptional regulator 


similar to putative RNA methyltransferase 


hypothetical CDS j 


similar to diadenosine tetraphosphatase, acid phosphatase | 


similar to unknown proteins 


similar to putative transcriptional regulator (TetR/AcrR family) C- 
terminal part 


similar to putative transcriptional regulator (TetR/AcrR family) N- 
terminal part 


similar to C protein alpha-antigen from Streptococcus 
agalactiae] N-terminal part 


similar to transposase, truncated. | 


similar to unknown proteins I 


similar to transcriptional regulator (TetR/AcrR family) j 


similar to transposase N-terminal part 


similar to unknown protein 


similar to chaperonin (heat shock protein 33 homolog) 


similar to transcriptional regulator (C-terminal part) | 


similar to transcriptional regulator (N-terminal part) | 


Putative peptidoglycan bound protein (LPXTG motif) I 


Putative peptidoglycan bound protein (LPXTG motif) 


similar to sortase protein 


similar to sortase protein | 


similar to unknown proteins 


50S Ribosomal protein L33 


|50S ribosomal protein L32 


histidyl-tRNA synthetase 


aspartyl-tRNA synthetase | 


similar to unknown proteins 


30S ribosomal protein S4 


similar to unknown proteins 


similar to unknown proteins 


arginyl-tRNA synthetase 


638356-639420 m 


639649-640932 p | 


640925-641437 p 


641494-642867 p 


642968-644323 p I 


644431-644652 p 


644770-645507 p 


645828-646346 p 


646475-646711 m | 


646692-647000 m 


647183-647515 p 


647636-648562 m 


1028864-1031071 m 


2175288-2175827 p 


648505-648780 m 


648913-649050 p ! 


649438-649785 m 


649979-650398 m 


650399-651187 m 


651570-653234 p 


653323-654246 p 


654248-655165 p 


655122-655973 p 


2175913-2176209 m 


2144199-2144348 p 


2144001-2144183 p 


2142501-2143781 m 


2140657-2142408 m 


2139723-2140667 m 


| 2176453-2177064 m 


I 2138743-2139615 m 


2138408-2138716 p 


2136629-2138320 p 


SA-787.1 | 
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SA-789.1 


SA-790.1 


SA-792.1 


SA-793.1 ! 


SA-794.1 


SA-795.1 


SA-796.1 


SA-797.1 


SA-798.1 


SA-799.1 


SA-8.1 


SA-80.1 


SA-800.1 


SA-801.1 


SA-803.1 


SA-804.1 


SA-805.1 


SA-806.1 


SA-807.1 


SA-808.1 


SA-809.3 


SA-81.1 


SA-811.2 


SA-812.1 


SA-814.1 


SA-817.2 


SA-819.2 


SA-82.1 


SA-820.1 


SA-821.1 


SA-822.1 


2150 ' 


2151 


2152 | 


2154 


2155 


2156 


2157 


2158 


2159 


! 2160 


2161 


2162 


2163 


2164 


2165 


2166 


2167 


; 2168 


2169 


2170 ! 


2171 


2172 
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2178 
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4293 ! 


4294 


4295 


4296 | 


4297 
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4301 
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4303 
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4311 
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SEQ ID n° 6434 j 
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SEQ ID n° 6436 i 


SEQ ID n° 6437 


SEQ ID n° 6438 


ISEQ ID n° 6439 
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SEQ ID n° 6441 i 
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similar to arginine repressor ArgR 


DNA mismatch repair protein MutS 


similar to cold shock protein E | 


similar to DNA mismatch repair MutL 


putative membrane-spanning protein (efflux transporter ?) 


similar to Holiday junction DNA helicase 


similar to unknown proteins 


similar to 3-methyl-adenine DNA glycosylase I 


similar to competence-damage inducible protein CinA 


recombination protein RecA 


similar to unknwon proteins 


similar to unknwon proteins | 


similar to unknown proteins 


similar to unknown proteins I 


similar to unknown proteins 


replicative DNA helicase DnaC 


Similar to trehalose-specific PTS enzyme IIABC 


similar to trehalose-6-phosphate hydrolase 


similar to hypothetical transcriptional antiterminator (BgIG family) 


similar to unknown proteins 


putative transmembrane protein similar to unknown proteins 


similar to other proteins (including putative transketolase) 


similar to other proteins (including putative transketolase) 


50S ribosomal protein L9 


similar to unknown proteins 


ribosomal protein S15 


polynucleotide phosphorylase, alpha chain 


similar to unknown protein 


similar to serine acetyltransferase 


Unknown 


cysteinyl-tRNA synthetase 


similar to unknown proteins 


similar to tRNA/rRNA methyltransferase 


similar to unknown protein 


similar to unknown proteins 


2135970-2136416 m \ 


2133337-2135913 m 


2133077-2133280 p 


2130878-2132851 m 


2129614-2130846 m 


2129022-2129612 m | 


2177394-2177681 m 


2128448-2128999 m 


2127100-2128359 m 


2125887-2127026 m | 


2125273-2125671 m | 


2124805-2125071 m 


2124386-2124805 m 


2124043-2124360 m 


2122252-2123793 m 


2177693-2179048 m 


216500-218530 p i 


218752-220377 p 


220597-222633 p 


222636-222920 p 


222933-224288 p 


224291-225148 p 


225145-226074 p 


2179091-2179543 m 


226102-227442 p 


227530-227799 p 


228180-230309 p 


230311-231063 p 


231072-231656 p 


231666-231848 p 


231845-233188 p 


233181-233567 p 


233676-234425 p 


234422-234940 p 


2179549-2181531 m 


SA-823. 1 


SA-825. 1 


SA-826.1 


SA-827. 1 


SA-828. 1 


SA-829. 1 


SA-83. 1 I 


SA-831. 1 I 


SA-832. 1 


SA-833. 1 


SA-834. 1 


SA-835. 1 


SA-837. 1 


SA-838. 1 


SA-839.2 


SA-84. 1 


SA-842.3 


SA-843.1 


SA-844. 1 


SA-845. 1 


SA-846. 1 


SA-848. 1 


SA-849. 1 


SA-85. 1 


SA-850. 1 


SA-851. 1 
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SA-853. 1 


SA-854. 1 


SA-855. 1 


SA-856. 1 


SA-857. 1 


SA-858. 1 


SA-859. 1 
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similar to unknown protein 


similar to transposase j 


tyrosyl-tRNA synthetase 


similar to penicillin-binding protein 1b 


RNA polymerase beta-subunit 


Similar to GidA protein | 


RNA polymerase beta -subunit I 


similar to unknown proteins | 


similar to transporter (competence protein) 


probably part of the DNA transport machinery, ComGB protein 


similar to exogenous DNA-binding protein comGC | 


similar to hypothetical competence proteins | 


similar to unknown proteins | 


similar to hypothetical competence proteins 


similar to unknown proteins j 


similar to unknown proteins j 


acetate kinase | 


similar to transcriptional regulator j 


similar to unknown proteins | 


Unknown 


similar to dihydroorotate dehydrogenase A 


similar to unknown proteins 


similar to Cell Wall Muropeptide Branching Enzyme 


similar to cell wall muropeptide branching enzyme 


similar to cell wall muropeptide branching enzyme | 


similar to unknown proteins 


similar to unknown proteins 


Similar to unknown proteins 


Similar to cation-transporting P-ATPase j 


similar to unknown proteins 


similar to fructose-1 ,6-bisphosphatase 


Similar to other proteins 


Unknown 


similar to tRNA (5-methylaminomethyl-2-thiouridylate)- 
methyltransferase 


235033-235893 p 


236878-238059 m 


181438-182697 m 


182808-185105 p 


185629-189204 p 


2181598-2183499 m 


189321-192971 p 


193085-193450 p 


193623-194594 p 


194440-195531 p 


195528-195857 p 


195832-196245 p 


196217-196516 p . 


196470-196931 p 


196909-197280 p 


197395-198369 p 


198401-199594 p \ 


199745-199951 p 


200188-200643 p 


579476-579673 p 


579717-580649 m 


2183669-2184280 m 


580836-582071 m 


582090-583301 m 


583314-584534 m 


584534-585346 m 


585417-586733 m 


586809-587195 p 


587539-590223 p 


590268-591 128 m 


591280-593211 p 


593301-594425 p 


1031191-1031673 m 


2184312-2185433 m 


SA-861.1 


SA-863.3 


SA-864.3 


SA-866.2 


SA-868. 1 


SA-87. 1 I 


SA-872. 1 


SA-874. 1 


SA-875. 1 


SA-876.1 


SA-877. 1 


SA-878. 1 


SA-879. 1 


SA-880.1 ! 


SA-881.1 


SA-882. 1 


SA-883. 1 


SA-884. 1 


SA-885.2 


SA-887.2 


SA-889. 1 


SA-89. 1 


SA-890. 1 


SA-891. 1 


SA-892. 1 


SA-893. 1 


2248 I SA-894. 1 


SA-895. 1 


SA-896. 1 


SA-897. 1 


SA-898. 1 


SA-899. 1 


SA-9.1 


SA-90.1 
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Similar to peptide chain release factor RF-2 


Similar to cell division ATP-binding protein FtsE 


596287-597216 p iSimilar to cell-division protein FtsX | 


Similar to unknown proteins j 


similar to unknown proteins | 


H+-transporting ATP synthase c chain 


H+-transporting ATP synthase a chain 


H+-transporting ATP synthase b chain | 


similar to L-serine dehydratase beta subunit 


H+-transporting ATP synthase delta chain 


H+-transporting ATP synthase alpha chain 


H+-transporting ATP synthase gamma chain | 


H+-transporting ATP synthase beta chain j 


H+-transporting ATP synthase epsilon chain | 


UDP-N-acetylglucosamine 1-carboxyvinyltransferase 


similar to competence associated membrane nuclease 


Phenylalanyl-tRNA synthetase alpha chain 


similar to other proteins 


Phenylalanyl-tRNA synthetase beta chain 


similar to unknown proteins (C-terminal part) 


similar to ATP-dependent exonuclease, subunit B 


similar to ATP-dependent exonuclease, subunit A 


similar to cation transporter | 


similar to putative tRNA modification GTPase TrmE 


similar to L-serine dehydratase alpha subunit 


iSimilar to ribonucleotide diphosphate reductase small subunit 


Similar to ribonucleotide reductase large subunit 


Similar to glutaredoxin 


Similar to histidine-containing phosphocarrier protein of the 
phosphotransferase system (PTS) 


phosphoenolpyruvate:sugar phosphotransferase system enzyme 
I 


similar to glyceraldehyde-3-phosphate dehydrogenase ! 


| similar to oligosaccharide deacetylase 


2187369-2188046 m j similar to other proteins 


594579-595592 p 1 


595611-596303 p 


597269-597979 m * 


597976-598611 m | 


909887-910087 p 


910120-910836 p 


910854-911351 p 


2185679-2186347 p I 


911351-911887 p 


91 1903-913408 p 


913424-914305 p j 


914379-915785 p 


915798-916211 p 


916569-917840 p 


918108-918965 p | 


919256-920296 p 


920379-920900 p 


920954-923359 p 


923428-924096 m 


924207-927440 p 


927430-931053 p 


931066-931992 p 


931967-933343 m 


2186362-2187234 p 


866828-867787 m 


867990-870149 m 


| 870227-870451 m 


870833-871096 p 


; 871101-872834 p 


872984-874411 p 


874551-875804 p 


SA-901.1 | 


SA-902.1 


SA-904.1 


SA-905.1 ! 
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SA-936.1 


SA-937.1 


SA-939.1 


SA-94.1 


2256 


2257 


2258 i 


2259 | 


4397 2260 


2261 ! 


2262 I 
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2266 | 
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2269 ' 
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I 4420 | 2283 
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4394 j 
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4396 I 


4398 
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4405 I 
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4408 
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4411 ! 
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4416 i 
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similar to RNA helicase 


similar to uridine kinase 


similar to unknown proteins 


similar to DNA polymerase III gamma/tau subunit 


similar to unknown proteins j 


similar to transcriptional repressor of the biotin operon 


S-adenosylmethionine synthetase 


similar to fibronectin-binding protein 


Unknown j 


hypothetical protein 


similar to unknown proteins 


similar to unknown proteins | 


similar to cation ABC transporter (ATP-binding protein) j 


Unknown | 


Similar to unknown protein 


Similar to DNA-methyltransferase | 


Similar to plasmid relaxase and mobilisation protein A 


similar to unknown proteins 


Unknown 


similar to aggregation promoting protein (adhesin involved in 
high frequency of conjugation) 


hypothetical CDS | 


Unknown 


similar to plasmid unknown proteins 


Unknown 


Similar to transfer complex protein TrsK - Lactococcus lactis 
plasmid pMRCOl 


Unknown 


Similar to gram positive plasmid protein 


Unknown 


Unknown 


similar to plasmid unknown proteins 


Unknown 


Similar to plasmid transfer complex protein TrsE j 


similar to two-component sensor histidine kinase 


Similar to D-alanine-D-alanyl carrier protein ligase 


875835-876917 m 


877062-877691 p 


877778-878275 p 


878275-879939 p ; 


880028-880222 p 


880203-881 138 m 


881323-882519 p 


883038-884945 p 


885012-885557 p 


885717-885845 p 


885953-886519 p 


886516-887070 p 


887074-888360 p \ 


1170326-1171621 m 


1171761-1172060 m 


1172071-1173318 m 


1173315-1174946 m 


1174918-1175292 m 


11 75295-1 175858 m 


2188179-2188718 m 


1175861-1176157 m 


1176201-1176500 m 


11 76552-1 179788 m 


1179790-1180155 m 


1180197-1182242 m 


1182242-1182733 m 


1182755-1183537 m 


1183537-1183809 m 


1183829-1184434 m 


1184455-1187145 m 


1187178-1187708 p 


1187902-1190292 m 


1899710-1900897 m 


1898029-1899564 m 


SA-941. 1 | 


SA-942. 1 


SA-943. 1 


SA-944. 1 | 


SA-945.1 i 


SA-946. 1 


SA-947. 1 


SA-948. 1 


SA-949. 1 


SA-950.1 | 


SA-951. 1 


SA-952. 1 


SA-953.2 


SA-954. 1 


SA-955. 1 1 


SA-956. 1 


SA-957. 1 


SA-958. 1 


SA-959. 1 


SA-96. 1 


SA-960. 1 


SA-961. 1 


SA-964. 1 


SA-966.1 


SA-967. 1 


SA-968. 1 


SA-969. 1 


SA-970. 1 


SA-971. 1 


SA-973. 1 


SA-974. 1 


SA-975.2 


SA-976.2 


SA-977.1 
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2292 
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2295 I 


2296 j 
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2306 | 
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2319 ; 
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4426 


4427 j 


4428 


4429 | 


4430 i 
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4434 | 
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4437 


4438 
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4440 i 
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SEQ ID n° 6584 


|SEQ ID n° 6585 


SEQ ID n° 6586 


SEQ ID n° 6587 


SEQ ID n° 6588 


SEQ ID n° 6589 


SEQ ID n° 6590 


SEQ ID n° 6591 


ISEQ ID n° 6592 


|SEQ ID n° 6593 


ISEQ ID n° 6594 


SEQ ID n° 6595 
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similar to LTA D-alanylation protein DItB 


putative ABC transporter (permease) | 


Similar to D-alanyl carrier protein 


similar to LTA D-alanine transfer protein DltD 


Unknown 


Unknown 


Unknown | 


Unknown j 


similar to unknown proteins 


similar to unknown proteins 


histidine triad family protein | 


Similar to 16 rRNA (adenine-N6,N6-)-dimethyltransferase 


1.2 Transport/binding proteins and lipoproteins 


Similar to 23S ribosomai RNA methyltransferase | 


similar to unknown proteins 


similar to ribulose-5-phosphate 3-epimerase 


Similar to unknown proteins | 


Similar to unknown proteins 


similar to unknown proteins 


similar to transcription repressor of purine operon PurR 


qimilarto unknown proteins 


similar to pyrroline-5-carboxylate reductase 


1896767-1898032 m 


2188934-2189728 m 


1896513-1896752 m 


1895258-1896520 m 


1894691-1895083 m 


1893399-1894691 m 


1893016-1893408 m 


1892725-1893006 m 


1891761-1892543 m 


1891208-1891774 m 


1890755-1891204 m 


1889856-1890728 m 


2189721-2190563 m 


1889001-1889852 m 


1887973-1888845 m j 


1887304-1887966 m 


1886679-1887311 m 


1885403-1886677 m 


1884472-1885413 m 


1883563-1884375 m 


200712-201377 p 


201398-202168 m 
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SA-983. 1 
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SA-99.1 
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2324 I 
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TABLEAU 4 . Localisation des 139 contigs de sequence SEQ ID No. 1 a SEQ ID No. 
139 sur la sequence genomique complete (SEQ ID No. 2345). 







Position sur genome 
complet (= SEQ ID n°2345) 


Sens 


SEQ ID 


Contig 


position ueout 


position rin 


(m=minus / 
p=plus) 


SEQ ID n°1 


Contigl 


1356648 


1355991 


m 


SEQ ID n°2 


Contig2 


341651 


341120 


m 


SEQ ID n°3 


Contig3 


476798 


476418 


m 


SEQ ID n°4 


Contig4 


1475712 


1475086 


m 


SEQ ID n°5 


ContigS 


784818 


784243 


m 


SEQ IDn°6 


Contig6 


1756826 


1757251 


P 


SEQIDn°7 


Contig7 


1950108 


1949648 


m 


SEQIDn°8 


Contig8 


138225 


138876 


P 


SEQ ID n°9 


Contig9 


2097891 


2098283 


P 


SEQIDn°10 


Contigl 0 


1238491 


1237984 


m 


SEQIDn°11 


Contigl 1 


1882130 


1881745 


m 


SEQIDn°12 


Contigl 2 


1089348 


1088935 


m 


SEQIDn°13 


Contigl 3 


555788 


555189 


m 


i SEQ ID n°14 


Contigl 4 


2017928 


2017437 


m 


i SEQIDn°15 


Contigl 5 


1154094 


1154701 


P 


SEQIDn°16 


Contigl 6 


752647 


753091 


P 


SEQIDn°17 


Contigl 7 


1355561 


1355078 


m 


; SEQIDn°18 


Contigl 8 


1255951 


1256101 


P 


SEQ IDn°19 


Contigl 9 


792712 


793148 


P 


SEQ ID n°20 


Contig20 


481787 


482228 


P 


SEQ ID n°22 


Contig22 


1590263 


1590842 


P 


SEQ ID n°23 


Contig23 


508269 


508918 


P 


SEQ ID n°24 


Contig24 


1142198 


1142488 


P 


SEQ ID n°25 


Contig25 


1982019 


1981737 


m 


SEQ ID n°26 


Contig26 


119342 


119919 


P 


SEQ ID n°28 


Contig28 


1124069 


1123256 


m 


SEQ ID n°29 


Contig29 


266586 


266900 


P 


SEQ ID n°30 


Contig30 


111013 


111623 


P 


SEQ ID n°31 


Contig31 


1804173 


1804706 


P 


SEQ ID n°32 


Contig32 


2170341 


2169828 


m 


SEQ ID n°33 


Contig33 


1959867 


1959394 


m 


SEQ ID n°34 


Contig34 


1295529 


1294939 


m 


SEQ ID n°35 


Contig35 


178592 


178071 


m 


SEQ ID n°36 


Contig36 


1857103 


1856614 


m 


SEQ ID n°37 


Contig37 


1063484 


1063911 


P 


SEQ ID n°38 


Contig38 


198025 


197570 


m 


SEQ ID n°39 


Contig39 


1486076 


1486553 


P 


SEQ ID n°40 


Contig40 


2033914 


2034352 


P 


SEQ ID n°41 


Contig41 


737932 


738486 


P 


SEQ ID n°42 


Contig42 


729008 


728453 


m 


SEQ ID n°43 


Contig43 


1671733 


1672151 


P 
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TABLEAU 5 . Propriete d'adherence a des cellules epitheliales humaines en culture de la 
souche NEM316 de S. agalactiae et de souches mutantes derivees. 



Souche 


Gene inactive 


% d'adhesion 3 






Cellules A549 


Cellules Hela 


NEM316 


aucun 


9 


16 


NEM1979 


IPFN° 126$ (srtA) 


1,5 


2 


NEM2056 


IPFN° 678 


2 


n.t. 


NEM2057 


IPFN° 1503 


4,5 


n.t. 



5 a , le pourcentage d'adhesion correspond au nombre de bacteries (Unite Formant des 
Colonies, UFC) restant adherentes aux cellules apres lavage avec du tampon PBS par 
rapport au nombre d'UFC ajoutees a la monocouche de cellules epitheliales. 
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Amidase 


AmylopuUulanase alkaline 


inconnue 
inconnue 


inconnue 
inconnue 


inconnue 


Surface exclusion protein 


inconnue 


Surface exclusion protein 


inconnue 


inconnue 


inconnue 


Proteine liant la fibronectine 


inconnue 
inconnue 


inconnue 


inconnue 


36 (54)/ 478 
35 (54)7492 


65 (79)/ 1095 


23(47)/ 373 
26(50) / 273 


37(52)/ 405 
36(52)/ 399 


33 (49)/ 225 


24 (37)/ 715 


31 (47)/ 263 


22 (40)/ 784 


33 (47)/ 211 






32(46)/ 176 


27(42)/ 512 
25(38)/ 577 






AmiC (S. pyogenes) 
YbgE (L lactis) 


PulA (S. pyogenes) 


CGI 5040 gene product Drosophila 

melanogaster 
Antigen p200 (Babesia bigemina) 


SpaA ( S. sobrinus) 
Pas (S. intermedius) 


Plasmid-encoded protein (E. faecalis) 


SeclO (E. faecalis) 


Plasmid-encoded protein (E. faecalis) 


SeclO (E. faecalis) 


Plasmid-encoded protein (E. faecalis) 


No homology in public databases 


No homology in public databases 


PFBP (S. pyogenes) 


Hypothetical protein 2 (Lactobacillus 

leichmannii) 
Fimbrial structural subunit (Actinomyces 
naeslundii) 


No homology in public databases 


No homology in public databases 
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TABLEAU 7 . Distribution des genes codant pour des proteines de surface a motif 
LPXTG parmi des isolats cliniques independants de 5 serotypes de& agalactiae. 



Seq ID 

(ADN) 


N° d'IPF 


Proportion des souches portant le gene 


Xype la 
23 isolats 


Type lb 
7 isolats 


Type II 
12 isolats 


Type III 
39 isolats 


Type V 

16 
isolats 


non 
groupe 
2 isolats 


Frequence 

totale 
yy isolats 


4926 


1503 


100 


100 


100 


100 


100 


100 


100 


6331 


678 


100 


100 


100 


100 


100 


100 


100 


5491 


2192 


100 


100 


100 


100 


100 


100 


100 


5234 


1861 


100 


100 


100 


100 


100 


100 


100 


6246 


584 


100 


100 


100 


100 


100 


100 


100 


5842 


280 


100 


100 


100 


100 


100 


100 


100 


6247 


585 


86,9 


85,7 


91,7 


92,3 


81,3 


100 


88,9 


4965 


1551 


34,8 


85,7 


100 


94,8 


93,8 


100 


80,8 


6447 


807 


26,1 


85,7 


83,3 


92,3 


93,8 


100 


79,8 


5610 


2337 


86,9 


100 


100 


56,4 


100 


50 


78,8 


6236 


571 


82,6 


100 


83,3 


46,1 


100 


50 


71,7 


5103 


1716 


91,0 


100 


83,3 


38,5 


81,3 


50 


67,7 


5607 


2334 


56,5 


100 


83,3 


46,1 


100 


50 


65,6 


6411 


765 


30,4 


71,4 


41,7 


61,5 


87,5 


100 


57,6 


4921 


15 


65,2 


0 


41,7 


59 


12,5 


50 


46,5 


5090 


17 


4,3 


14,3 


16,7 


20,5 


6,3 


0 


13,1 


5180 


18 


4,3 


14,3 


0 


20,5 


6,3 


0 


11,1 


4706 


1248 


0 


0 


0 


12,8 


6,3 


0 


6 


5497 


220 


0 


14,3 


8,3 


5,1 


0 


0 


4,5 


4708 


1250 


0 


14,3 


0 


5,1 


0 


0 


3 


5677 


2414 


0 


0 


0 


7,7 


0 


0 


3 
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TABLEAU 8 . Lipoproteins 



Seq ID 

(ADN) 


N° 
d'IPF 


/\nnoiauon 


6527 


9 


unknown 


6030 


339 


similar to unknown proteins 


6035 


344 


Similar to ABC transporter (binding protein) 


6137 


460 


Similar to ABC transporter (binding protein) 


6178 


504 


similar to unknown proteins 


6294 


638 


Similar to unknown proteins 


6335 


682 


Similar to adhesion proteins 


6377 


729 


similar to oligopeptide and pheromone binding protein 


6386 


739 


similar to other lipoprotein 


4495 


1018 


Similar to (oligopeptide) ABC transporter (binding protein) 


4596 


1119 


similar to ribose ABC transporter (binding protein) 


4636 


1162 


similar to (amino acid ?) ABC transporter (binding protein) 


4730 


1280 


similar to ABC transporter (binding protein) 


4816 


1377 


Similar to nickel ABC transporter (binding protein) 


4836 


1399 


similar to phosphate ABC transporter (binding protein) 


4906 


1481 


Similar to D,D-carboxypeptidase 


4920 


1499 


similar to peptidyl-prolyl cis-trans isomerase 


4925 


1502 


similar to metal ABC transporter (binding protein) 


4963 


1547 


Unknown 


5021 


1617 


Similar to unknown lipoprotein 


5158 


1775 


similar to ferrichrome ABC transporter (binding protein) 


5247 


1879 


similar to oligopeptide ABC transporter (binding protein) 


5306 


1955 


similar to glycine betaine/carnitine/choline ABC transporter (osmoprotectant- 
binding protein) 


5417 


2099 


similar to putative ABC transporter (binding protein) 


5423 


2103 


Unknwon, similar to unknown protein and to B. subtilis SpoIIIJ protein 


5450 


2133 


laminin-binding surface protein 


5486 


2185 


putative ABC transporter (binding protein) 



WO 02/092818 



421 



PCT/IB02/03059 



5559 


2278 


putative ABC transporter (binding protein) 


5591 


2314 


similar to protease maturation protein 


5677 


2414 


Similar to plasmid related proteins, Putative peptidoglycan bound protein 
(LPXTG motif) 


5718 


2464 


Similar to unknown proteins 


5732 


2482 


similar to ferrichrome ABC transporter (binding protein) 


5799 


2597 


similar to amino acid ABC transporter (binding protein) 


5800 


2598 


similar to phosphate ABC transporter (binding protein) 


5837 


2789 


Unknown 


5861 


2843 


Similar to amino acid ABC transporter (binding protein) 


5883 


2875 


Unknown 


5923 


2922 


Similar to amino acid ABC transporter (binding protein) 



Les genes codant pour des lipoproteines ont ete identifies sur la base de la 
prediction du motif de coupure / modification de type lipoproteine [S. Hayashi, H. C. 
Wu. J Bioenerg Biomembr. 22, 451 (1990)] et d'un peptide signal (identifie en utilisant 
5 SignalP vs2.0 [H Nielsen, Prot Engirt 12, 13-9. (1999)]) et par l'analyse des resultats de 
comparaison sur les banques de sequence proteiques en utilisant BLAST [S. F. Altschul 
et al., Nucleic Acids Res 25, 3389-402. (1997)]. 

Tableau 9 . Autres proteines de surface 



10 



Seq ID 

(ADN) 


N° d'IPF 


Annotation 


6037 


347 


group B streptococcal surface immunogenic protein 


4972 


1562 


Putative cell wall protein, weakly similar to peptidase or esterase 


6569 


948 


similar to fibronectin-binding protein 


5234 


1861 


similar to cell wall proteins 


5530 


2238 


possible surface protein 


5223 


1847 


CAMP factor 
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Ces proteines ont ete identifiees sur la base de similarity avec d'autres proteines 
de surface bacterienne et la prediction d'un peptide signal et ne faisant pas partie des 
classes des proteines ancrees au peptidoglycane et lipoproteines. 



5 TABLEAU 10 . Proteines impliquees dans la biosynthese de composes 
polysaccharidiques de la paroi de S. agalactiae. 



Seq ID 


N° d'IPF 


Annotation 


Commentaires 


4861 


1430 


similar to Streptococcus mutans RgpG protein required for 
biosynthesis of rhamnose-glucose polysaccharide 




6214 


544 


similar to rhamnosyltransferase 




6061 


381 


Unnown, Similar to UDP-N-acetylmuramoylalanine--D- 
glutamate ligase 




6517 


890 


similar to Cell Wall Muropeptide Branching Enzyme 




6518 


891 


similar to cell wall muropeptide branching enzyme 




6519 


892 


similar to cell wall muropeptide branching enzyme 




4743 


1295 


similar to glycosyltransferases 




6343 


692 


similar to hexosyltransferase 




6342 


691 


similar to glucosyl transferase 




5326 


1977 


Similar to UDP-D-glucose:galactosyl glucosyltransferase 




4952 


1532 


similar to N-acetylneuraminic acid synthetase 


Biosynthese de 
la capsule 


5619 


2346 


capsular polysaccharide biosynthesis protein 


5618 


2345 


similar to glycosyl transferase 


5617 


2344 


similar to glycosyl transferase 


5616 


2343 


capsular polysaccharide repeating-unit polymerase 


5615 


2342 


beta- 1 ,4-galactosyltransferase 


5614 


2341 


beta- 1 ,4-galactosyltransferase enhancer 


5613 


2340 


similar to glucose- 1 -phosphate transferase 


5611 


2339 


capsular polysaccharide chain length regulator/exporter 


5696 


2437 


putative chain length regulator CpsC 




5971 


301 


similar to dTDP-glucose-4,6-dehydratase 




5233 


1860 


similar to to Cell Wall Muropeptide Branching Enzyme 
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5602 


2329 


similar to capsular polyglutamate biosynthesis 




5156 


1773 


Similar to UDP-N-acetylmuramoylalanyl-D-glutamyl-2, 6- 
diaminopimelate ligase 




5574 


2297 


Similar to putative hexosyltransferase 




5573 


2296 


Similar to rhamnosyl transferase I 




5654 


2386 


Similar to capsular polysaccharide synthesis protein 




5656 


2388 


Similar to putative rhamnosyltransferase 




5526 


2233 


Similar to putative rhamnosyltransferase 




5527 


2235 


Similar to nucleotide-sugar dehydratase 




5529 


2237 


Similar to Pneumococcal LicD2 protein involved in 
phosphorylcholine metabolism 




5534 


2241 


similar to rhamnosyltransferase 




5625 


2354 


similar to putative rhamnosyltransferase 




5626 


2355 


dTDP-L-rhamnose synthase 




6223 


555 


Similar to putative glucosyl transferase 




6229 


562 


Similar to hypothetical glycosyl transferase 




6230 


563 


Similar to putative glycosyltransferase 




6231 


565 


Similar to putative glycosyl transferase 




6232 


566 


Similar to putative glycosyl transferase 




6233 


567 


Similar to putative glycosyl transferase 




5764 


2518 


similar to putative sugar transferase 




6095 


416 


similar to UDP-N-acetylglucosamine pyrophosphorylase 




5089 


1699 


Similar to UDP-N-acetylmuramate-alanine ligase 




5466 


2158 


similar to glycosyl transferase 




5465 


2157 


similar to glycosyl transferase 





Ces genes ont ete identifies par Tanalyse des resultats de similarity avec les 
sequences proteiques connues en utilisant le logiciel BLASTP. Les produits de ces 
genes pourraient intervenir dans la biosynthese de polysaccharides qui pourraient etre 
5 des constituants de preparations vaccinales. 
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REVINDICATIONS 



1. Sequence nucleotidique isolee de Streptococcus agalactiae, caracterisee en 
ce qu'elle est choisie parmi les sequences SEQ ID No. 1 a SEQ ID No. 139 et SEQ ID 

5 No. 2345. 

2. Sequence nucleotidique isolee de Streptococcus agalactiae, caracterisee en 
ce qu'elle est choisie parmi : 

a) une sequence nucleotidique comportant au moins 75 % d'identite avec une sequence 
choisie parmi SEQ ID No. 1 a SEQ ID No. 139 et SEQ ID No. 2345 ; 
10 b) une sequence nucleotidique hybridant dans des conditions de forte stringence avec 
une sequence choisie parmi SEQ ID No. 1 a SEQ ID No. 139 et SEQ ID No. 2345, et 
comprenant au moins 20 nucleotides ; 

c) une sequence nucleotidique complementaire d'une sequence choisie parmi SEQ ID 
No. 1 a SEQ ID No. 139 et SEQ ID No. 2345, ou complementaire d'une sequence 

1 5 nucleotidique telle que definie en a), ou b), ou une sequence nucleotidique de l'ARN 

correspondant a Tune des sequences a) ou b) ; 

d) une sequence nucleotidique d'un fragment representatif d'une sequence choisie 
parmi SEQ ID No. 1 a SEQ ID No. 139 et SEQ ID No. 2345, ou d'un fragment 
representatif d'une sequence nucleotidique telle que definie en a), b) ou c) et 

20 comprenant au moins 20 nucleotides ; 

e) une sequence nucleotidique comprenant une sequence telle que definie en a), b), c) 
ou d) ; et 

f) une sequence nucleotidique telle que definie en a), b), c), d) ou e) modifiee et 
comportant au plus 10 % de nucleotides modifies par rapport a la sequence de 

25 reference. 

3. Sequence nucleotidique selon la revendication 2, caracterisee en ce qu'il 
s'agit d'une sequence issue d'une sequence choisie parmi SEQ ID No. 1 a SEQ ID No. 
139 et SEQ ID No. 2345, et en ce qu'elle code pour un polypeptide, choisi de 
preference parmi les sequences SEQ ID No. 140 a SEQ ID No. 2344 et SEQ ID No. 

30 2346 a SEQ ID No. 448 1 . 

4. Sequence nucleotidique caracterisee en ce qu'elle comprend une sequence 
nucleotidique choisie parmi : 

a) une sequence nucleotidique selon la revendication 3 ou choisie parmi les sequences 
SEQ ID No. 4482 a SEQ ID No. 6617 ; 
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b) une sequence nucleotidique comportant au moins 75 % d'identite avec une sequence 
nucleotidique selon la revendication 3 ; 

c) une sequence nucleotidique s'hybridant dans des conditions de forte stringence avec 
une sequence nucleotidique selon la revendication 3 et comprenant au moins 20 

5 nucleotides ; 

d) une sequence nucleotidique complementaire ou d'ARN correspondant a une 
sequence telle que definie en a), b) ou c) ; 

e) une sequence nucleotidique d'un fragment representatif d'une sequence telle que 
definie en a), b), c) ou d) et comprenant au moins 20 nucleotides ; et 

10 f) une sequence telle que definie en a), b), c), d) ou e) modifiee et comportant au plus 
10 % de nucleotides modifies par rapport a la sequence de reference. 

5. Polypeptide code par une sequence nucleotidique selon Tune des 
revendications 2 a 4. 

6. Polypeptide selon la revendication 5, caracterise en ce qu'il est choisi parmi 
15 les polypeptides choisis parmi SEQ ID No. 140 a SEQ ID No. 2344, et SEQ ID No. 

2346 a SEQ ID No. 4481. 

7. Polypeptide caracterise en ce qu'il comprend un polypeptide choisi parmi : 

a) un polypeptide selon Tune des revendications 5 et 6 ; 

b) un polypeptide presentant au moins 80 % d'identite avec un polypeptide selon Tune 
20 des revendications 5 et 6 ; 

c) un fragment d'au moins 5 acides amines d'un polypeptide selon Tune des 
revendications 5 et 6, ou tel que defini en b) ; 

d) un fragment biologiquement actif d'un polypeptide selon l'une des revendications 5 
et 6, ou tel que defini en b) ou c) ; et 

25 e) un polypeptide selon l'une des revendications 5 et 6 ou tel que defini en b), c) ou d) 
modifie et comportant au plus 10 % d'acides amines modifies par rapport a la 
sequence de reference. 

8. Sequence nucleotidique codant pour un polypeptide selon la revendication 

7. 

30 9. Sequence nucleotidique isolee codant pour un polypeptide specifique de 

Streptococcus agalactiae choisi parmi les polypeptides de sequence SEQ ID No. 140 a 
SEQ ID No. 2344 et SEQ ID No. 2346 a SEQ ID No. 4481 . 
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10. Sequence nucleotidique selon l'une des revendications 2 a 4, 8 et 9, 
caracterisee en ce qu'elle code pour un polypeptide de Streptococcus agalactiae 
implique dans la biosynthese des acides amines ou Tun de ses fragments. 

11. Sequence nucleotidique selon Tune des revendications 2 a 4, 8 et 9, 
5 caracterisee en ce qu'elle code pour un polypeptide de Streptococcus agalactiae 

implique dans la biosynthese des cofacteurs, groupes prosthetiques et transporters ou 
Tun de ses fragments. 

12. Sequence nucleotidique selon Tune des revendications 2 a 4, 8 et 9, 
caracterisee en ce qu'elle code pour un polypeptide d'enveloppe cellulaire ou situe a la 

1 0 surface de Streptococcus agalactiae ou Tun de ses fragments. 

13. Sequence nucleotidique selon Tune des revendications 2 a 4, 8 et 9, 
caracterisee en ce qu'elle code pour un polypeptide de Streptococcus agalactiae 
implique dans la machinerie cellulaire ou Pun de ses fragments. 

14. Sequence nucleotidique selon l'une des revendications 2 a 4, 8 et 9, 
15 caracterisee en ce qu'elle code pour un polypeptide de Streptococcus agalactiae 

implique dans le metabolisme intermediaire central ou l'un de ses fragments. 

15. Sequence nucleotidique selon Tune des revendications 2 a 4, 8 et 9, 
caracterisee en ce qu'elle code pour un polypeptide de Streptococcus agalactiae 
implique dans le metabolisme energenique ou l'un de ses fragments. 

20 16. Sequence nucleotidique selon l'une des revendications 2 a 4, 8 et 9, 

caracterisee en ce qu'elle code pour un polypeptide de Streptococcus agalactiae 
implique dans le metabolisme des acides gras et des phospholipides ou l'un de ses 
fragments. 

17. Sequence nucleotidique selon l'une des revendications 2 a 4, 8 et 9, 
25 caracterisee en ce qu'elle code pour un polypeptide de Streptococcus agalactiae 

implique dans le metabolisme des nucleotides, des purines, des pyrimidines ou 
nucleosides ou l'un de ses fragments. 

18. Sequence nucleotidique selon l'une des revendications 2 a 4, 8 et 9, 
caracterisee en ce qu'elle code pour un polypeptide de Streptococcus agalactiae 

30 implique dans les fonctions de regulation ou l'un de ses fragments. 

19. Sequence nucleotidique selon l'une des revendications 2 a 4, 8 et 9, 
caracterisee en ce qu'elle code pour un polypeptide de Streptococcus agalactiae 
implique dans le processus de replication ou l'un de ses fragments. 
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20. Sequence nucleotidique selon Tune des revendications 2 a 4, 8 et 9, 
caracterisee en ce qu'elle code pour un polypeptide de Streptococcus agalactiae 
implique dans le processus de transcription ou Tun de ses fragments. 

21. Sequence nucleotidique selon Tune des revendications 2 a 4, 8 et 9, 
5 caracterisee en ce qu'elle code pour un polypeptide de Streptococcus agalactiae 

implique dans le processus de traduction ou Tun de ses fragments. 

22. Sequence nucleotidique selon Tune des revendications 2 a 4, 8 et 9, 
caracterisee en ce qu'elle code pour un polypeptide de Streptococcus agalactiae 
implique dans le processus de transport et de liaison des proteines ou l'un de ses 

1 0 fragments. 

23. Sequence nucleotidique selon Tune des revendications 2 a 4, 8 et 9, 
caracterisee en ce qu'elle code pour un polypeptide de Streptococcus agalactiae 
implique dans Padaptation aux conditions atypiques ou l'un de ses fragments. 

24. Sequence nucleotidique selon l'une des revendications 2 a 4, 8 et 9, 
15 caracterisee en ce qu'elle code pour un polypeptide de Streptococcus agalactiae 

implique dans la sensibilite aux medicaments et analogues ou l'un de ses fragments. 

25. Sequence nucleotidique selon l'une des revendications 2 a 4, 8 et 9, 
caracterisee en ce qu'elle code pour un polypeptide de Streptococcus agalactiae 
implique dans les fonctions relatives aux transposons ou l'un de ses fragments. 

20 26. Sequence nucleotidique isolee de Streptococcus agalactiae, caracterisee en 

ce qu'elle est choisie parmi : 

a) une sequence choisie parmi les sequences SEQ ID N° 
61 94,6236,5497,5791 ,5 1 03,4705,56 1 0,5234,4926,633 1 ,6247,5842,574 1 ,492 1 ,5090,5 1 8 
0,4706,4708,5677,6246,6411,5578,6446,6447,5607,6209,6215,5406,5658,4965, de 

25 preference parmi les sequences SEQ ID N°4926,633 1,5491,5234,6246,5842 ; 

b) une sequence nucleotidique comportant au moins 75 % d'identite avec une 
sequence nucleotidique du a) ; 

c) une sequence nucleotidique s'hybridant dans des conditions de forte 
stringence avec une sequence nucleotidique du a) ou b) et comprenant au moins 20 

30 nucleotides ; 

d) une sequence nucleotidique complementaire ou d'ARN correspondant a une 
sequence telle que definie en a), b) ou c) ; 

e) une sequence nucleotidique d'un fragment representatif d'une sequence telle 
que definie en a), b), c) ou d) et comprenant au moins 20 nucleotides ; et 
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f) une sequence telle que definie en a), b), c), d) ou e) modifiee et comportant 
au plus 10 % de nucleotides modifies par rapport a la sequence de reference ; 

et en ce qu'elle code pour une proteine de surface avec un motif d'ancrage 
LPXTG. 

5 27. Sequence nucleotidique isolee de Streptococcus agalactiae, caracterisee en 

ce qu'elle est choisie parmi les sequences SEQ ID 
N°6035,6137,6335,6377,6386,44^ 

247, 5306 3 5417,5450 ? 5486 9 5559 5 5591,5677 9 5732 ? 5799 ? 5800,5861 5 5923 et en ce qu'elle 
code pour une lipoproteine. 
10 28. Sequence nucleotidique isolee de Streptococcus agalactiae, caracterisee en 

ce qu'elle est choisie parmi les sequences SEQ ID 
N°4861,6214,6061,6517,6518,6519,4743,6343^ 

615,5614,5613,5611,5696,5971,5233,5602,5156,5574,5573,5654,5656,5526,5527,552 

,5534,5625,5626,6223,6229,6230,6231,6232,6233,5764,6095,5089,5466,5465 et en ce 
15 qu'elle code pour une proteine impliquee dans la biosynthese de composes 

polysaccharidiques de paroi. 

29. Polypeptide selon Tune des revendications 5 a 7, caracterise en ce qu'il 

s'agit d'un polypeptide de Streptococcus agalactiae implique dans la biosynthese des 

acides amines ou Fun de ses fragments. 
20 30. Polypeptide selon l'une des revendications 5 a 7, caracterise en ce qu'il 

s'agit d'un polypeptide de Streptococcus agalactiae implique dans la biosynthese des 

cofacteurs, groupes prosthetiques et transporters ou l'un de ses fragments. 

31. Polypeptide selon l'une des revendications 5 a 7, caracterise en ce qu'il 
s'agit d'un polypeptide d'enveloppe cellulaire ou situ<§ a la surface de Streptococcus 

25 agalactiae ou l'un de ses fragments. 

32. Polypeptide selon l'une des revendications 5 a 7, caracterise en ce qu'il 
s'agit d'un polypeptide de Streptococcus agalactiae implique dans la machinerie 
cellulaire ou l'un de ses fragments. 

33. Polypeptide selon l'une des revendications 5 a 7, caracterise en ce qu'il 
30 s'agit d'un polypeptide de Streptococcus agalactiae implique dans le metabolisme 

intermediaire central ou l'un de ses fragments. 

34. Polypeptide selon l'une des revendications 5 a 7, caracterise en ce qu'il 
s'agit d'un polypeptide de Streptococcus agalactiae' implique dans le metabolisme 
energetique ou l'un de ses fragments. 
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35. Polypeptide selon Tune des revendications 5 a 7, caracterise en ce qu'il 
s'agit d'un polypeptide de Streptococcus agalactiae implique dans le metabolisme des 
acides gras et des phospholipides ou Pun de ses fragments. 

36. Polypeptide selon l'une des revendications 5 a 7, caracterise en ce qu'il 
5 s'agit d'un polypeptide de Streptococcus agalactiae implique dans le metabolisme des 

nucleotides, des purines, des pyrimidines ou nucleosides ou Pun de ses fragments. 

37. Polypeptide selon Pune des revendications 5 a 7, caracterise en ce qu'il 
s'agit d'un polypeptide de Streptococcus agalactiae implique dans les fonctions de 
regulation ou Pun de ses fragments. 

10 38. Polypeptide selon Pune des revendications 5 a 7, caracterise en ce qu'il 

s'agit d'un polypeptide de Streptococcus agalactiae implique dans le processus de 
replication ou Pun de ses fragments. 

39. Polypeptide selon l'une des revendications 5 a 7, caracterise en ce qu'il 
s'agit d'un polypeptide de Streptococcus agalactiae implique dans le processus de 

1 5 transcription ou Pun de ses fragments. 

40. Polypeptide selon Pune des revendications 5 a 7, caracterise en ce qu'il 
s'agit d'un polypeptide de Streptococcus agalactiae implique dans le processus de 
traduction ou Pun de ses fragments. 

41. Polypeptide selon l'une des revendications 5 a 7, caracterise en ce qu'il 
20 s'agit d'un polypeptide de Streptococcus agalactiae implique dans le processus de 

transport et de liaison des proteines ou Pun de ses fragments. 

42. Polypeptide selon Pune des revendications 5 a 7, caracterise en ce qu'il 
s'agit d'un polypeptide de Streptococcus agalactiae implique dans Padaptation aux 
conditions atypiques ou Pun de ses fragments. 

25 43. Polypeptide selon Pune des revendications 5 a 7, caracterise en ce qu'il 

s'agit d'un polypeptide de Streptococcus agalactiae implique dans la sensibilite aux 
medicaments et analogues ou Pun de ses fragments. 

44. Polypeptide selon Pune des revendications 5 a 7, caracterise en ce qu'il 
s'agit d'un polypeptide de Streptococcus agalactiae implique dans les fonctions 

30 relatives aux transposons ou Pun de ses fragments. 

45. Polypeptide selon Pune des revendications 5 a 7, caracterise en ce qu'il est 
code par une sequence selon la revendication 26 et est une proteine de surface avec un 
motif d'ancrage LPXTG. 
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46. Polypeptide selon Tune des revendications 5 a 7, caracterise en ce qu'il est 
code par une sequence selon la revendication 27 et est une lipoproteine. 

47. Polypeptide selon Tune des revendications 5 a 7, caracterise en ce qu'il est 
code par une sequence selon la revendication 28 et est une proteine impliquee dans la 

5 biosynthese de composes polysaccharidiques de paroi. 

48. Sequence nucleotidique utilisable comme amorce ou comme sonde, 
caracterisee en ce que ladite sequence est choisie parmi les sequences nucleotidiques 
selon Tune des revendications 2 a 4, 8 a 28. 

49. Sequence nucleotidique selon la revendication 48, caracterisee en ce qu'elle 
1 0 est marquee par un compose radioactif ou par un compose non radioactif. 

50. Sequence nucleotidique selon Tune des revendications 48 et 49, caracterisee 
en ce qu'elle est immobilisee sur un support, de maniere covalente ou non-covalente. 

51. Sequence nucleotidique selon la revendication 50, caracterisee en ce qu'elle 
est immobilisee sur un support tel qu'un filtre a haute densite ou une puce a ADN. 

15 52. Sequence nucleotidique selon Tune des revendications 49 a 51 pour la 

detection et/ou P amplification de sequences nucleiques. 

53. Puce a ADN ou filtre, caracterisee en ce qu'elle contient au moins une 
sequence nucleotidique selon la revendication 5 1 . 

54. Puce a ADN ou filtre selon la revendication 53, caracterisee en ce qu'elle 
20 contient en outre au moins une sequence nucleotidique d'un micro-organisme autre que 

Streptococcus agalactiae, immobilisee sur le support de ladite puce. 

55. Puce a ADN ou filtre selon la revendication 54, caracterisee en ce que le 
micro-organisme autre est choisi parmi un micro-organisme associe a Streptococcus 
agalactiae, une bacterie du genre Streptococcus, et un variant de Streptococcus 

25 agalactiae. 

56. Kit ou necessaire pour la detection et/ou 1' identification de bacteries 
appartenant a l'espdce Streptococcus agalactiae ou a un micro-organisme associe, 
caracterise en ce qu'il comprend une puce k ADN ou un filtre selon la revendication 53. 

57. Kit ou necessaire pour la detection et/ou 1' identification d'un micro- 
30 organisme, caracterise en ce qu'il comprend une puce a ADN ou un filtre selon Tune des 

revendications 54 et 55. 

58. Kit ou necessaire pour la detection et/ou la quantification de l'expression 
d'au moins un gene de Streptococcus agalactiae, caracterise en ce qu'il comprend une 
puce a ADN ou un filtre selon Tune des revendications 53 a 55. 



WO 02/092818 



432 



PCT/IB02/03059 



59. Vecteur de clonage, et/ou d' expression, caracterise en ce qu'il contient une 
sequence nucleotidique selon Tune des revendications 1 a 4, 8 a 28. 

60. Cellule hote, caracterisee en ce qu'elle est transformee par un vecteur selon 
la revendication 59. 

5 61. Cellule hote selon la revendication 60, caracterisee en ce qu'il s'agit d'une 

bacterie appartenant au genre Streptococcus. 

62. Cellule hote selon la revendication 61, caracterisee en ce qu'il s'agit d'une 
bacterie appartenant a l'espece Streptococcus agalactiae. 

63. Vegetal ou animal, excepte 1' Homme, comprenant une cellule transformee 
1 0 selon Tune des revendications 60 a 62. 

64. Procede de preparation d'un polypeptide, caracterise en ce que Ton cultive 
une cellule transformee par un vecteur selon la revendication 59 dans des conditions 
permettant 1'expression dudit polypeptide et que Ton recupere ledit polypeptide 
recombinant. 

15 65. Polypeptide recombinant susceptible d'etre obtenu par un procede selon la 

revendication 64. 

66. Procede de preparation d'un polypeptide synthetique selon 1'une des 
revendications 5 a 7, 29 a 47, caracterise en ce que Ton effectue une synthese chimique 
dudit polypeptide. 

20 67. Polypeptide hybride, caracterise en ce qu'il comprend au moins la sequence 

d'un polypeptide selon l'une des revendications 5 a 7, 29 a 47 et 65, et une sequence 
d'un polypeptide susceptible d'induire une reponse immunitaire chez l'homme ou 
P animal. 

68. Sequence nucleotidique codant pour un polypeptide hybride selon la 
25 revendication 67. 

69. Vecteur caracterise en ce qu'il contient une sequence nucleotidique selon la 
revendication 68. 

70. Anticorps monoclonal ou polyclonal, ses fragments, ou anticorps 
chimerique, caracterise en ce qu'il est capable de reconnaitre specifiquement un 

30 polypeptide selon l'une des revendications 5 a 7, 29 a 47, 65 et 67. 

71. Anticorps selon la revendication 70, caracterise en ce qu'il s'agit d'un 
anticorps marque. 
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72 Procede pour la detection et/ou 1' identification de bacteries appartenant a 
l'espece Streptococcus agalactiae ou a un micro-organisme associe dans un echantillon 
biologique, caracterise en ce qu'il comprend les etapes suivantes : 

a) mise en contact de l'echantillon biologique avec un anticorps selon Tune des 
5 revendications 70 et 71 ; 

b) mise en evidence du complexe antigene-anticorps eventuellement forme. 

73. Procede pour la detection de l'expression d'un gene de Streptococcus 
agalactiae caracterise en ce que Ton met en contact une souche de Streptococcus 
agalactiae , avec un anticorps selon la revendication 70 ou 71 et que Ton detecte le 

1 0 complexe antigene/anticorps eventuellement forme. 

74. Kit ou necessaire pour la mise en oeuvre d'un procede selon la revendication 
72 ou 73, caracterise en ce qu'il comprend les elements suivants : 

a) un anticorps selon Tune des revendications 70 et 71 ; 

b) eventuellement, les reactifs pour la constitution du milieu propice a la reaction 
1 5 immunologique ; 

c) eventuellement, les reactifs permettant la mise en evidence des complexes antigene- 
anticorps produits par la reaction immunologique. 

75. Polypeptide selon Tune des revendications 5 a 7, 32 a 47, 65 et 67, ou 
anticorps selon Tune des revendications 64 et 65, caracterise en ce qu'il est immobilise 

20 sur un support, notamment une puce a proteine. 

76. Puce a proteine, caracterisee en ce qu'elle contient au moins un polypeptide 
selon l'une des revendications 5 a 7, 32 a 47, 65 et 67, ou au moins un anticorps selon 
1'une des revendications 70 et 71, immobilise sur le support de ladite puce. 

77. Puce a proline selon la revendication 76, caracterisee en ce qu'elle contient 
25 en outre au moins un polypeptide de micro-organisme autre que Streptococcus 

agalactiae ou au moins un anticorps dirige contre un compose de micro-organisme autre 
que Streptococcus agalactiae, immobilise sur le support de ladite puce. 

78. Kit ou necessaire pour la detection et/ou 1' identification de bacteries 
appartenant a l'espece Streptococcus agalactiae ou a un micro-organisme associe, 

30 caracterise en ce qu'il comprend une puce a proteine selon l'une des revendications 76 
et 77. 

79. Kit ou necessaire pour la detection et/ou Identification d'un micro- 
organisme, caracterise en ce qu'il comprend une puce k proteine selon la revendication 
77. 



WO 02/092818 



434 



PCT/IB02/03059 



80. Procede de detection et/ou d' identification de bacteries appartenant a 
l'espece Streptococcus agalactiae ouaun micro-organisme associe dans un echantillon 
biologique, caracterise en ce qu'il met en oeuvre une sequence nucleotidique selon Tune 
des revendications 2 a 4, 8, 9, 1 1 a 13, 17 a 25, 48 a 52 et 68. 
5 81. Procede selon la revendication 80, caracterise en ce qu'il comporte les 

etapes suivantes : 

a) eventuellement, isolement de l'ADN a partir de l'echantillon biologique a analyser, 
ou obtention d'un ADNc a partir de TARN de l'echantillon biologique ; 

b) amplification specifique de 1'ADN de bacteries appartenant a l'espece Streptococcus 
10 agalactiae ouaun micro-organisme associe a l'aide d'au moins une amorce selon 

Tune des revendications 48 a 52 ; 

c) mise en evidence des produits d f amplification. 

82. Procede selon la revendication 80, caracterise en ce qu'il comprend les 
etapes suivantes : 

15 a) mise en contact d'une sonde nucleotidique selon Tune des revendications 48 a 52, 
avec un echantillon biologique, 1'acide nucleique contenu dans l'echantillon 
biologique ayant, le cas echeant, prealablement ete rendu accessible a l'hybridation, 
dans des conditions permettant l'hybridation de la sonde a 1'acide nucleique d'une 
bacterie appartenant a l'espece Streptococcus agalactiae ou aim micro-organisme 

20 associe ; 

b) mise en evidence de l'hybride eventuellement forme entre la sonde nucleotidique et 
1'acide nucleique de l'echantillon biologique. 

83. Procede selon la revendication 80, caracterise en ce qu'il comprend les 
etapes suivantes : 

25 a) mise en contact d'une sonde nucleotidique immobilisee sur un support selon la 
revendication 50 avec un echantillon biologique, 1'acide nucleique de l'echantillon 
ayant, le cas echeant, ete prealablement rendu accessible a l'hybridation, dans des 
conditions permettant l'hybridation de la sonde a 1'acide nucleique d'une bacterie 
appartenant a l'espece Streptococcus agalactiae ouaun micro-organisme associe ; 

30 b) mise en contact de l'hybride forme entre la sonde nucleotidique immobilisee sur un 
support et 1'acide nucleique contenu dans l'echantillon biologique, le cas echeant 
apres elimination de 1'acide nucleique de l'echantillon biologique n'ayant pas 
hybride avec la sonde, avec une sonde nucleotidique marquee selon la revendication 
49; 
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c) mise en evidence du nouvel hybride forme a Petape b). 

84. Procede selon la revendication 83, caracterise en ce que, prealablement a 
Petape a), PADN de Pechantillon biologique ou PADNc obtenu eventuellement par 
transcription inverse de TARN de Pechantillon, est amplifie a Paide d'au moins une 

5 amorce selon Tune des revendications 48 a 52. 

85. Kit ou necessaire pour la detection et/ou P identification de bacteries 
appartenant a Pespece Streptococcus agalactiae ou a un micro-organisme associe, 
caracterise en ce qu'il comprend les elements suivants : 

a) une sonde nucleotidique selon Pune des revendications 48 a 52; 
10 b) eventuellement, les reactifs necessaires a la mise en oeuvre d'une reaction 
d'hybridation ; 

c) eventuellement, au moins une amorce selon Pune des revendications 48 a 52 ainsi 
que les reactifs necessaires a une reaction d' amplification de PADN. 

86. Kit ou necessaire pour la detection et/ou P identification de bacteries 
15 appartenant a Pespece Streptococcus agalactiae ou a un micro-organisme associe, 

caracterise en ce qu'il comprend les elements suivants : 

a) une sonde nucleotidique, dite sonde de capture, selon la revendication 50 ; 

b) une sonde oligonucleotidique, dite sonde de revelation, selon la revendication 49; 

c) eventuellement, au moins une amorce selon Pune des revendications 48 a 52 ainsi 
20 que les reactifs necessaires a une reaction d'amplification de PADN. 

87. Kit ou necessaire pour la detection et/ou P identification de bacteries 
appartenant a Pespece Streptococcus agalactiae ou a un micro-organisme associe, 
caracterise en ce qu'il comprend les elements suivants : 

a) au moins une amorce selon Pune des revendications 48 a 52; 
25 b) eventuellement, les reactifs necessaires pour effectuer une reaction d'amplification 
d'ADN; 

c) eventuellement, un composant permettant de verifier la sequence du fragment 
amplifie, plus particulierement une sonde oligonucleotidique selon Pune des 
revendications 48 a 52. 

30 88. Procede selon les revendications 72, 73 et 80 a 84 ou kit ou necessaire selon 

les revendications 74, 78, 79 et 85 a 87 pour la detection et/ou P identification de 
bacteries appartenant a Pespece Streptococcus agalactiae, caracterise en ce que ladite 
amorce et/ou ladite sonde sont choisies parmi les sequences nucleotidiques selon Pune 
des revendications 2 a 4, 8 a 28, 48 a 52, et 68 specifiques de Pespece Streptococcus 
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agalactiae, en ce que lesdits polypeptides sont choisis parmi les polypeptides selon 
1'une des revendications 5 a 7, 32 a 47, 65 et 67 specifiques de Pespece Streptococcus 
agalactiae et en ce que lesdits anticorps sont choisis parmi les anticorps selon Tune des 
revendications 70 et 71 diriges contre les polypeptides choisis parmi les polypeptides 
5 selon Tune des revendications 5 a 7, 32 a 47, 65 et 67 specifiques de l'espece 
Streptococcus agalactiae. 

89. Souche de Streptococcus agalactiae, caracterisee en ce qu'elle contient au 
moins une mutation dans au moins une sequence nucleotidique selon Tune des 
revendications 2 a 4, 8 a 28. 
10 90. Souche de Streptococcus agalactiae selon la revendication 89, caracterisee 

en ce que la mutation mene a une inactivation du gene. 

91. Souche de Streptococcus agalactiae selon la revendication 89, caracterisee 
en ce que la mutation mene a une surexpression du gene. 

92. Utilisation d'une sequence nucleotidique selon Tune des revendications 2 a 
15 4,8 a 28, d'un polypeptide selon Tune des revendications 5 a 7, 32 a 47, 65 et 67 d'un 

anticorps selon Tune des revendications 70 et 71, d'une cellule selon Tune des 
revendications 60 a 62, et/ou d'un animal transforme selon la revendication 63 pour la 
selection de compose organique ou inorganique capable de moduler, de reguler, 
d'induire ou d'inhiber 1' expression de genes, et/ou de modifier la replication cellulaire 
20 de cellules eucaryotes ou procaryotes ou capables d'induire, d'inhiber ou d'aggraver 
chez un organisme animal ou humain les pathologies liees a une infection par 
Streptococcus agalactiae ou par un micro-organisme associe. 

93. Methode de selection de compose capable de se lier a un polypeptide selon 
Tune des revendications 5 a 7, 32 a 47, 65 et 67, capable de se lier a une sequence 

25 nucleotidique selon Tune des revendications 2 a 4, 8 a 28, ou capable de reconnaitre un 
anticorps selon Tune des revendications 70 et 71, et/ou capable de moduler, de reguler, 
d'induire ou d'inhiber l'expression de genes, et/ou de modifier la replication cellulaire 
de cellules eucaryotes ou procaryotes, ou capable d'induire, d'inhiber ou d'aggraver 
chez un organisme animal ou humain les pathologies liees a une infection par 
30 Streptococcus agalactiae, caracterisee en ce qu'elle comprend les etapes suivantes : 

a) mise en contact dudit compose avec ledit polypeptide, ladite sequence nucleotidique, 
avec une cellule transformee selon Tune des revendications 60 a 62, et/ou 
administration dudit compose a un animal transforme selon la revendication 63 ; 
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b) determination de la capacite dudit compose a se Her avec ledit polypeptide ou ladite 
sequence nucleotidique, ou de moduler, de reguler, d'induire ou d'inhiber 
l'expression de genes, ou de moduler la croissance ou la replication cellulaire, ou 
d'induire, d'inhiber ou d'aggraver chez ledit organisme animal ou humain les 

5 pathologies liees a une infection par Streptococcus agalactiae ou par un micro- 

organisme associe. 

94. Composition pharmaceutique comprenant un compose choisi parmi les 
composes suivants : 

a) une sequence nucleotidique selon l'une des revendications 2 a 4, 8 a 28 ; 
10 b) un polypeptide selon Tune des revendications 5 a 7, 32 a 47, 65 et 67; 

c) un vecteur selon la revendication 59 ou 69 ; et 

d) un anticorps selon la revendication 70 ou 71. 

95. Composition selon la revendication 94, eventuellement en association avec 
un vehicule pharmaceutiquement acceptable. 

1 5 96. Composition pharmaceutique selon Tune des revendications 94 et 95 pour la 

prevention et le traitement d'une infection par une bacterie appartenant a l'espece 
Streptococcus agalactiae. 

97. Composition immunogene, caracterisee en ce qu'elle comprend un ou 
plusieurs polypeptides selon Tune des revendications 5 a 7, 32 a 47, 65, et/ou un ou 

20 plusieurs polypeptides hybrides selon la revendication 67. 

98. Utilisation d'une cellule selon Tune des revendications 60 a 62, ou d'un 
vecteur selon Tune des revendications 59 ou 69 pour la preparation d'une composition 
vaccinale. 

99. Composition vaccinale, caracterisee en ce qu'elle contient un 
25 polynucleotide selon Tune des revendications 1 a 4, 8 a 28, un vecteur selon l'une des 

revendications 59 ou 69, et/ou une cellule selon Tune des revendications 60 a 62. 

100. Composition vaccinale, caracterisee en ce qu'elle contient au moins un 
polypeptide code par un polynucleotide de sequence choisie parmi SEQ ID 
N° 1 503,678,2 1 92, 1861,5 84,280. 

30 101. Composition vaccinale selon la revendication 100, caracterisee en ce qu'il 

s'agit d'une composition veterinaire 

102. Composition immunogene capable d'induire une reponse immunitaire 
cellulaire ou humorale pour la prevention ou le traitement d'une infection par une 
bacterie appartenant a l'espece Streptococcus agalactiae, caracterisee en ce qu'elle 
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comprend une composition immunogene selon la revendication 97, ou une composition 
vaccinale selon la revendication 99 ou 100, en association avec un vehicule 
pharmaceutiquement acceptable et eventuellement un ou plusieurs adjuvants de 
Timmunite appropries. 

5 103. Banque genomique de Streptococcus agalactiae CIP 82.45 (ATCC 

12403). 

104. Banque d'ADN genomique selon la revendication 101, caracterisee en ce 
que ladite banque d'ADN est clonee dans un plasmide. 

105. Banque selon la revendication 101 ou 102, caracterisee en ce qu'il s'agit 
10 de la banque deposee a la CNCM le 28 decembre 2000 sous le N° 1-2610. 

106. Utilisation des banques genomiques selon Tune des revendications 101 a 
103 pour isoler des sequences nucleotidiques specifiques de Streptococcus agalactiae, 
caracterisee en ce que les sequences nucleotidiques de Streptococcus autres que 
Streptococcus agalactiae CIP 82.45 (ATCC 12403) sont alignees et en ce que les 

15 donnees obtenues par cet alignement sont traitees pour isoler lesdites sequences 
specifiques. 

107. Procede d ? identification de sequence specifique de Streptococcus 
agalactiae, caracterise par Talignement de sequences nucleotidiques de Streptococcus 
agalactiae selon les revendications 1 a 4, 8 a 9 et le traitement des donnees obtenues par 

20 cet alignement pour isoler les sequences specifiques. 

108. Souche mutante NEM 1979 de Streptococcus agalactiae selon la 
revendication 89 deposee a la CNCM le 24 avril 2002 sous le N° 1-2861. 

109. Souche mutante NEM 2056 de Streptococcus agalactiae selon la 
revendication 89 deposee a la CNCM le 24 avril 2002 sous le N° 1-2862. 

25 110. Souche mutante NEM 2057 de Streptococcus agalactiae selon la 

revendication 89 deposee a la CNCM le 24 avril 2002 sous le N° 1-2863. 
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une influence sur les pathologies liees a une infection par 
S. agalactiae; compositions pharmaceutiques; puces a ADN et 
proteine; kit ou necessaire contenant lesdites puces; 
vecteur de clonage, cellule hote, vegetal ou animal 
contenant la sequence nucleotidique; utilisation des 
anti corps et des sequences nucleotidiques pour 
1 'identification de Streptococcus agalactiae; souche de S. 
agalactiae contenant une mutation dans la sequence SEQ ID 
N0:1; utilisation des sequences nucleotidiques pour 
identifier des sequences specifiques de S. agalactiae. 



2. revendi cations: Partiellement 1-102, 107-110 

Idem au sujet 1 pour, respectivement les sequences 
nucleotidiques SEQ ID N0s:2-139, 2345, and 4482-6617 



3. revendi cations: 103-106 

Banque genomique de Straptococcus agalactiae et son 
utilisation 
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